نوشته گیل داتون
یکی از بزرگترین موانع تجزیه و تحلیل برای تولیدکنندگان زیستی، نیاز به آماده سازی داده ها به گونه ای است که آنها را برای سیستم های تحلیلی قابل دسترسی و برای کاربران نهایی ارزشمند کند. پیادهسازی رویکرد DataOps، چارچوبی که دادهها را در سرتاسر محیط تولید زیستی حاکم و استاندارد میکند، تجزیه و تحلیل زمان واقعی و مقایسه دسته به دسته را امکانپذیر میسازد.
راجیو آناند، بنیانگذار و مدیر عامل Quartic.ai، می گوید ژنرال که مشتریانی که رویکرد DataOps را پیادهسازی میکنند، بازدهی را بین 10 تا 40 درصد افزایش داده و سازگاری دسته به دسته را بهبود میبخشند. در یک مورد، عملکرد خالص 12 درصد افزایش یافت و تنوع تا 49 درصد کاهش یافت.
دستیابی به چنین نتایجی مستلزم آمادهسازی دادهها برای مصرف توسط الگوریتمها و مدلها در زمان نزدیک به جای تجزیه و تحلیل مستقیم توسط انسانها است. با این رویکرد، تغییرات را می توان در لحظه شناسایی و تنظیم کرد و در نتیجه نتایج را بهبود بخشید. در نتیجه، دادهها باید به گونهای متفاوت تهیه شوند تا بتوان از آنها در سیستمهای تحلیل خودکار و متصل به هم استفاده کرد و بنابراین از مقایسه دسته به دسته پشتیبانی کرد.
آناند میگوید: «این جایی است که DataOps وارد میشود… دادهها را برای هر یک از ابزارهایی که تحلیلگر انتخاب میکند برای تحقیقات یا نظارت آنلاین تجهیزات و فرآیندها در دسترس قرار میدهد». این امر مستلزم استانداردسازی، با استفاده از مراحلی مانند پاکسازی و فیلتر کردن داده ها، هم ترازی زمانی، زمینه سازی تجهیزات و مدل های فرآیند، و تعیین قراردادهای نامگذاری است.
از دریاچه های داده در تولید خودداری کنید
یکی از شگفتیهای بزرگ برای تولیدکنندگان این است که مخازن دادههای استاتیک (دریاچههای داده) که برای دادههای تجاری بسیار مؤثر هستند، برای تولید زیستی مناسب نیستند. او توضیح میدهد که به این دلیل است که دادههای تولید زیستی چندوجهی هستند و محصول، فرآیند، تجهیزات و تعاملات آنها و همچنین رویدادها و دادههایی که به صورت دستی در دفترچههای ثبت ثبت شدهاند را در بر میگیرد. «یک عنصر زمان دخیل است. این فقط جداول داده های ثابت نیست.
بنابراین، Anand به تولیدکنندگان زیستی توصیه میکند که قبل از شروع آمادهسازی دادهها، به دقت در مورد برنامه کاربردی و مشکلی که در تلاش برای حل آن هستند فکر کنند. او میگوید: «بهعنوان مثال، قرار دادن دادههای سری زمانی در یک جدول SQL و انتظار کارکرد آن (غیر واقعی است). باید با زمان همگام سازی شود، تا تغییرپذیری در حین ساخته شدن دسته در نظر گرفته شود. به همین ترتیب، “آنچه به اطراف می چرخانید باید به مشکلی که در حال حل آن هستید بستگی داشته باشد.”
آناند می افزاید که درک و حسابداری این و سایر نکات ظریف تولید زیستی در چارچوب DataOps نیازمند مشارکت فعال متخصصان تولید زیستی در تیم DataOps است. تیمهایی که از تولید زیستی و همچنین متخصصان فناوری اطلاعات استفاده میکنند، بهتر میتوانند هر شکاف دانشی را پر کنند و بنابراین چارچوب DataOps بهتر و قویتری ایجاد کنند.
The post رویکرد DataOps کاهش تنوع و افزایش بازده اولین بار در GEN – اخبار مهندسی ژنتیک و بیوتکنولوژی پدیدار شد.