جرمی کلوی، معاون مهندسی تجزیه و تحلیل، داده ها و هوش مصنوعی در EDB – سری مصاحبه


جرمی (جز) کلوی معاون مهندسی در EDB، مستقر در شمال غربی اقیانوس آرام، ایالات متحده آمریکا. او تیمی را رهبری می کند که بر ارائه راه حل های تحلیلی و هوش مصنوعی مبتنی بر Postgres متمرکز شده است. Jezz با تجربه در مدیریت پایگاه داده به عنوان سرویس (DBaaS)، رهبری عملیاتی و ارائه فناوری نوآورانه، پیشینه قوی در پیشبرد پیشرفت‌ها در فناوری‌های نوظهور دارد.

EDB از PostgreSQL برای همسویی با اولویت‌های تجاری پشتیبانی می‌کند، امکان توسعه برنامه‌های بومی ابری، مهاجرت مقرون‌به‌صرفه از پایگاه‌های داده قدیمی، و استقرار انعطاف‌پذیر در محیط‌های ترکیبی را فراهم می‌کند. با استعداد در حال رشد و عملکرد قوی، EDB امنیت، قابلیت اطمینان و تجربیات مشتری برتر را برای برنامه‌های کاربردی حیاتی تضمین می‌کند.

چرا Postgres به طور فزاینده ای به پایگاه داده ای برای ساخت برنامه های کاربردی هوش مصنوعی مولد تبدیل می شود و چه ویژگی های کلیدی آن را برای این چشم انداز در حال تکامل مناسب می کند؟

با نزدیک به 75 درصد از میان شرکت‌های آمریکایی که هوش مصنوعی را اتخاذ می‌کنند، این کسب‌وکارها به یک فناوری اساسی نیاز دارند که به آنها اجازه می‌دهد به سرعت و به راحتی به داده‌های فراوان خود دسترسی داشته باشند و هوش مصنوعی را به طور کامل در آغوش بگیرند. این جایی است که Postgres وارد می شود.

Postgres شاید نمونه فنی کاملی از یک فناوری پایدار باشد که در عصر هوش مصنوعی محبوبیت بیشتری نسبت به قبل پیدا کرده است. با معماری قوی، پشتیبانی بومی از انواع داده های متعدد، و توسعه پذیری از طریق طراحی، Postgres کاندیدای اصلی برای شرکت هایی است که به دنبال استفاده از ارزش داده های خود برای هوش مصنوعی آماده تولید در یک محیط مستقل و امن هستند.

در طول 20 سالی که EDB وجود داشته است، یا 30 سالی که Postgres به عنوان یک فناوری وجود داشته است، صنعت از طریق تحولات، تغییرات و نوآوری ها حرکت کرده است، و از طریق آن همه کاربران همچنان به “فقط استفاده از Postgres” برای مقابله با پیچیده ترین داده های خود ادامه می دهند. چالش ها

امروزه چگونه Retrieval-Augmented Generation (RAG) به کار گرفته می‌شود و به نظر شما چگونه آینده «اقتصاد هوشمند» را شکل می‌دهد؟

جریان های RAG با دلیل موجه محبوبیت و شتاب قابل توجهی پیدا می کنند! هنگامی که در چارچوب «اقتصاد هوشمند» چارچوب‌بندی می‌شود، جریان‌های RAG دسترسی به اطلاعات را به روش‌هایی امکان‌پذیر می‌کنند که تجربه انسان را تسهیل می‌کند، و با خودکارسازی و فیلتر کردن داده‌ها و خروجی‌های اطلاعات در زمان صرفه‌جویی می‌کند که در غیر این صورت نیاز به تلاش دستی و زمان قابل توجهی برای ایجاد خواهد داشت. افزایش دقت مرحله «جستجو» (بازیابی) همراه با امکان افزودن محتوای خاص به یک LLM آموزش دیده، فرصت های فراوانی را برای تسریع و افزایش تصمیم گیری آگاهانه با داده های مرتبط فراهم می کند. یک راه مفید برای اندیشیدن در این مورد این است که گویی یک دستیار پژوهشی ماهر دارید که نه تنها اطلاعات درست را پیدا می کند، بلکه آن را به روشی متناسب با زمینه ارائه می دهد.

برخی از مهم‌ترین چالش‌هایی که سازمان‌ها هنگام اجرای RAG در تولید با آن مواجه هستند، چیست و چه استراتژی‌هایی می‌تواند به رفع این چالش‌ها کمک کند؟

در سطح اساسی، کیفیت داده‌های شما عامل تمایز هوش مصنوعی شماست. دقت و به‌ویژه پاسخ‌های تولید شده یک برنامه RAG همیشه تابع کیفیت داده‌هایی است که برای آموزش و تقویت خروجی استفاده می‌شود. سطح پیچیدگی که توسط مدل تولیدی اعمال می‌شود، اگر/جایی که ورودی‌ها ناقص باشند، کمتر سودمند خواهد بود، که منجر به نتایج کمتر مناسب و غیرمنتظره‌ای برای پرس و جو می‌شود (اغلب به عنوان “توهم” نامیده می‌شود). کیفیت منابع داده شما همیشه کلید موفقیت محتوای بازیابی شده است که مراحل تولید را تغذیه می کند – اگر می خواهید خروجی تا حد امکان دقیق باشد، منابع داده متنی برای LLM باید تا حد ممکن باشد. تا حد امکان تاریخ

از دیدگاه عملکرد؛ اتخاذ یک وضعیت پیشگیرانه در مورد آنچه که برنامه RAG شما در تلاش است به آن دست یابد – به همراه زمان و مکان بازیابی داده ها – شما را به خوبی می تواند تأثیرات بالقوه را درک کنید. برای مثال، اگر جریان RAG شما داده‌ها را از منابع داده تراکنشی بازیابی می‌کند (یعنی DBهایی که دائماً به‌روزرسانی می‌شوند و برای کسب‌وکار شما حیاتی هستند)، نظارت بر عملکرد آن منابع داده کلیدی، همراه با برنامه‌هایی که داده‌ها را از این منابع می‌گیرند، انجام می‌شود. درک تأثیر مراحل جریان RAG خود را ارائه دهید. این معیارها گامی عالی برای مدیریت هرگونه پیامدهای بالقوه یا بلادرنگ بر عملکرد منابع داده تراکنشی حیاتی هستند. علاوه بر این، این اطلاعات همچنین می تواند زمینه با ارزشی را برای تنظیم برنامه RAG برای تمرکز بر بازیابی مناسب داده فراهم کند.

با توجه به ظهور پایگاه های داده برداری تخصصی برای هوش مصنوعی، Postgres چه مزایایی نسبت به این راه حل ها ارائه می دهد، به ویژه برای شرکت هایی که به دنبال عملیاتی کردن حجم کاری هوش مصنوعی هستند؟

یک پایگاه داده برداری ماموریت حیاتی توانایی پشتیبانی از بارهای کاری سختگیرانه هوش مصنوعی را دارد و در عین حال امنیت داده ها، در دسترس بودن و انعطاف پذیری را برای ادغام با منابع داده موجود و اطلاعات ساختاریافته تضمین می کند. ایجاد یک راه حل AI/RAG اغلب از یک پایگاه داده برداری استفاده می کند زیرا این برنامه ها شامل ارزیابی شباهت و توصیه هایی هستند که با داده های با ابعاد بالا کار می کنند. پایگاه داده های برداری به عنوان یک منبع داده کارآمد و موثر برای ذخیره سازی، مدیریت و بازیابی برای این خطوط لوله داده حیاتی عمل می کنند.

چگونه EDB Postgres با پیچیدگی‌های مدیریت داده‌های برداری برای هوش مصنوعی برخورد می‌کند و مزایای کلیدی ادغام بارهای کاری هوش مصنوعی در محیط Postgres چیست؟

در حالی که Postgres قابلیت برداری بومی ندارد، pgvector پسوندی است که به شما امکان می دهد داده های برداری خود را در کنار بقیه داده های خود در Postgres ذخیره کنید. این به شرکت‌ها اجازه می‌دهد تا از قابلیت‌های برداری در کنار ساختارهای پایگاه‌داده موجود بهره ببرند و مدیریت و استقرار برنامه‌های کاربردی هوش مصنوعی را با کاهش نیاز به ذخیره‌های داده جداگانه و انتقال داده‌های پیچیده ساده‌تر کنند.

با تبدیل شدن Postgres به یک بازیگر اصلی در حجم کاری تراکنش‌ها و تحلیلی، چگونه به سازمان‌ها کمک می‌کند خطوط لوله داده خود را ساده‌سازی کنند و بینش‌های سریع‌تر را بدون افزودن پیچیدگی باز کنند؟

این خطوط داده به طور موثری به برنامه های هوش مصنوعی کمک می کند. با تعداد بی‌شمار قالب‌های ذخیره‌سازی داده، مکان‌ها و انواع داده‌ها، پیچیدگی‌های چگونگی دستیابی به مرحله بازیابی به سرعت به یک چالش ملموس تبدیل می‌شود، به‌ویژه زمانی که برنامه‌های هوش مصنوعی از اثبات مفهوم به سمت تولید حرکت می‌کنند.

پسوند EDB Postgres AI Pipelines نمونه ای از این است که چگونه Postgres نقش کلیدی در شکل دادن به بخش «مدیریت داده» داستان برنامه هوش مصنوعی ایفا می کند. ساده‌سازی پردازش داده‌ها با خطوط لوله خودکار برای واکشی داده‌ها از Postgres یا ذخیره‌سازی اشیا، ایجاد جاسازی‌های برداری به‌عنوان داده‌های جدید، و راه‌اندازی به‌روزرسانی‌ها برای جاسازی‌ها هنگام تغییر داده‌های منبع – یعنی داده‌های همیشه به‌روز برای پرس و جو و بازیابی بدون تعمیر و نگهداری خسته‌کننده. .

چه نوآوری‌ها یا پیشرفت‌هایی را می‌توانیم از Postgres در آینده نزدیک انتظار داشته باشیم، به‌ویژه که هوش مصنوعی همچنان به تکامل خود ادامه می‌دهد و از زیرساخت‌های داده بیشتر تقاضا می‌کند؟

پایگاه داده برداری به هیچ وجه یک مقاله تمام شده نیست، توسعه و بهبود بیشتر انتظار می رود زیرا استفاده و اتکا به فناوری پایگاه داده برداری همچنان در حال رشد است. جامعه PostgreSQL همچنان به نوآوری در این فضا ادامه می‌دهد و به دنبال روش‌هایی برای بهبود نمایه‌سازی است تا معیارهای جستجوی پیچیده‌تر را در کنار پیشرفت خود قابلیت pgvector فراهم کند.

Postgres، به ویژه با پیشنهادات EDB، چگونه از نیاز به استقرار ابرهای چندگانه و ترکیبی پشتیبانی می کند، و چرا این انعطاف پذیری برای شرکت های مبتنی بر هوش مصنوعی مهم است؟

یک مطالعه اخیر EDB نشان می‌دهد که 56 درصد از شرکت‌ها اکنون بارهای کاری حیاتی را در یک مدل ترکیبی به کار می‌گیرند که نیاز به راه‌حل‌هایی را برجسته می‌کند که از چابکی و حاکمیت داده پشتیبانی می‌کنند. Postgres، با پیشرفت‌های EDB، انعطاف‌پذیری اساسی را برای محیط‌های ابری چند ابری و ترکیبی فراهم می‌کند و به شرکت‌های مبتنی بر هوش مصنوعی این امکان را می‌دهد تا داده‌های خود را با انعطاف‌پذیری و کنترل مدیریت کنند.

EDB Postgres AI چابکی ابر و قابلیت مشاهده را به محیط های ترکیبی با کنترل مستقل می آورد. این رویکرد به شرکت‌ها اجازه می‌دهد تا مدیریت مدل‌های هوش مصنوعی را کنترل کنند، در حالی که حجم کاری معاملاتی، تحلیلی و هوش مصنوعی را در محیط‌های ترکیبی یا چند ابری ساده‌سازی می‌کنند. EDB با فعال کردن قابلیت حمل داده‌ها، کنترل TCO دانه‌ای و تجربه‌ای شبیه ابر در زیرساخت‌های مختلف، از شرکت‌های مبتنی بر هوش مصنوعی در تحقق پاسخ‌های سریع‌تر و چابک‌تر به نیازهای داده پیچیده‌تر پشتیبانی می‌کند.

همانطور که هوش مصنوعی در سیستم های سازمانی جاسازی می شود، Postgres چگونه از حاکمیت داده، حریم خصوصی و امنیت پشتیبانی می کند، به ویژه در زمینه مدیریت داده های حساس برای مدل های هوش مصنوعی؟

از آنجایی که هوش مصنوعی به سنگ بنای عملیاتی و تمایز رقابتی تبدیل می‌شود، شرکت‌ها با فشار فزاینده‌ای برای حفاظت از یکپارچگی داده‌ها و رعایت استانداردهای انطباق دقیق مواجه می‌شوند. این چشم‌انداز در حال تحول، حاکمیت داده‌ها را در جلو و محور قرار می‌دهد – جایی که حکمرانی دقیق، امنیت و دیده شدن فقط اولویت‌ها نیستند، بلکه پیش‌نیازها هستند. کسب‌وکارها باید بدانند و مطمئن باشند که داده‌هایشان کجاست و به کجا می‌رود.

Postgres به عنوان ستون فقرات برای محیط های داده آماده هوش مصنوعی برتری دارد و قابلیت های پیشرفته ای برای مدیریت داده های حساس در تنظیمات ترکیبی و چند ابری ارائه می دهد. اساس منبع باز آن به این معنی است که شرکت‌ها از نوآوری مداوم بهره می‌برند، در حالی که پیشرفت‌های EDB پایبندی به امنیت در سطح سازمانی، کنترل‌های دسترسی دقیق و قابلیت مشاهده عمیق را تضمین می‌کند – کلیدی برای مدیریت مسئولانه داده‌های هوش مصنوعی. قابلیت‌های هوش مصنوعی مستقل EDB بر اساس این وضعیت استوار است و بر روی آوردن قابلیت هوش مصنوعی به داده‌ها تمرکز می‌کند، بنابراین کنترل بر روی مکان و مکان حرکت داده‌ها را تسهیل می‌کند.

چه چیزی باعث می‌شود EDB Postgres به‌طور منحصربه‌فردی قادر به مقیاس‌بندی حجم‌های کاری هوش مصنوعی در عین حفظ در دسترس بودن و عملکرد بالا، به ویژه برای برنامه‌های کاربردی حیاتی باشد؟

هوش مصنوعی EDB Postgres با نزدیک‌تر کردن سیستم‌های تحلیلی و هوش مصنوعی به داده‌های عملیاتی و تراکنشی اصلی مشتریان – که همگی از طریق Postgres مدیریت می‌شوند، به ارتقای زیرساخت داده‌ها به یک دارایی فناوری استراتژیک کمک می‌کند. با کاهش پیچیدگی زیرساخت، بهینه سازی کارایی هزینه، و برآورده کردن الزامات سازمانی برای حاکمیت داده، عملکرد و امنیت، پایه پلت فرم داده را برای برنامه های مبتنی بر هوش مصنوعی فراهم می کند.

یک پلتفرم داده زیبا برای اپراتورهای مدرن، توسعه دهندگان، مهندسان داده و سازندگان برنامه های کاربردی هوش مصنوعی که برای بارهای کاری حیاتی خود به یک راه حل اثبات شده در نبرد نیاز دارند و امکان دسترسی به تجزیه و تحلیل و قابلیت های هوش مصنوعی را در حین استفاده از سیستم پایگاه داده عملیاتی اصلی شرکت فراهم می کند.

با تشکر از شما برای مصاحبه عالی، خوانندگانی که مایل به کسب اطلاعات بیشتر هستند باید از آن بازدید کنند EDB.



منبع:unite.ai

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *