رویکرد DataOps تغییرپذیری را کاهش می دهد و بازده را افزایش می دهد


نوشته گیل داتون

یکی از بزرگترین موانع تجزیه و تحلیل برای تولیدکنندگان زیستی، نیاز به آماده سازی داده ها به گونه ای است که آنها را برای سیستم های تحلیلی قابل دسترسی و برای کاربران نهایی ارزشمند کند. پیاده‌سازی رویکرد DataOps، چارچوبی که داده‌ها را در سرتاسر محیط تولید زیستی حاکم و استاندارد می‌کند، تجزیه و تحلیل زمان واقعی و مقایسه دسته به دسته را امکان‌پذیر می‌سازد.

راجیو آناند، بنیانگذار و مدیر عامل Quartic.ai، می گوید ژنرال که مشتریانی که رویکرد DataOps را پیاده‌سازی می‌کنند، بازدهی را بین 10 تا 40 درصد افزایش داده و سازگاری دسته به دسته را بهبود می‌بخشند. در یک مورد، عملکرد خالص 12 درصد افزایش یافت و تنوع تا 49 درصد کاهش یافت.

دستیابی به چنین نتایجی مستلزم آماده‌سازی داده‌ها برای مصرف توسط الگوریتم‌ها و مدل‌ها در زمان نزدیک به جای تجزیه و تحلیل مستقیم توسط انسان‌ها است. با این رویکرد، تغییرات را می توان در لحظه شناسایی و تنظیم کرد و در نتیجه نتایج را بهبود بخشید. در نتیجه، داده‌ها باید به گونه‌ای متفاوت تهیه شوند تا بتوان از آن‌ها در سیستم‌های تحلیل خودکار و متصل به هم استفاده کرد و بنابراین از مقایسه دسته به دسته پشتیبانی کرد.

آناند می‌گوید: «این جایی است که DataOps وارد می‌شود… داده‌ها را برای هر یک از ابزارهایی که تحلیلگر انتخاب می‌کند برای تحقیقات یا نظارت آنلاین تجهیزات و فرآیندها در دسترس قرار می‌دهد». این امر مستلزم استانداردسازی، با استفاده از مراحلی مانند پاکسازی و فیلتر کردن داده ها، هم ترازی زمانی، زمینه سازی تجهیزات و مدل های فرآیند، و تعیین قراردادهای نامگذاری است.

از دریاچه های داده در تولید خودداری کنید

یکی از شگفتی‌های بزرگ برای تولیدکنندگان این است که مخازن داده‌های استاتیک (دریاچه‌های داده) که برای داده‌های تجاری بسیار مؤثر هستند، برای تولید زیستی مناسب نیستند. او توضیح می‌دهد که به این دلیل است که داده‌های تولید زیستی چندوجهی هستند و محصول، فرآیند، تجهیزات و تعاملات آن‌ها و همچنین رویدادها و داده‌هایی که به صورت دستی در دفترچه‌های ثبت ثبت شده‌اند را در بر می‌گیرد. «یک عنصر زمان دخیل است. این فقط جداول داده های ثابت نیست.

بنابراین، Anand به تولیدکنندگان زیستی توصیه می‌کند که قبل از شروع آماده‌سازی داده‌ها، به دقت در مورد برنامه کاربردی و مشکلی که در تلاش برای حل آن هستند فکر کنند. او می‌گوید: «به‌عنوان مثال، قرار دادن داده‌های سری زمانی در یک جدول SQL و انتظار کارکرد آن (غیر واقعی است). باید با زمان همگام سازی شود، تا تغییرپذیری در حین ساخته شدن دسته در نظر گرفته شود. به همین ترتیب، “آنچه به اطراف می چرخانید باید به مشکلی که در حال حل آن هستید بستگی داشته باشد.”

آناند می افزاید که درک و حسابداری این و سایر نکات ظریف تولید زیستی در چارچوب DataOps نیازمند مشارکت فعال متخصصان تولید زیستی در تیم DataOps است. تیم‌هایی که از تولید زیستی و همچنین متخصصان فناوری اطلاعات استفاده می‌کنند، بهتر می‌توانند هر شکاف دانشی را پر کنند و بنابراین چارچوب DataOps بهتر و قوی‌تری ایجاد کنند.

The post رویکرد DataOps کاهش تنوع و افزایش بازده اولین بار در GEN – اخبار مهندسی ژنتیک و بیوتکنولوژی پدیدار شد.