EPFLdan ko'proq moslashuvchan sun'iy intellekt uchun yangi multimodal model

U matn, tasvir, video va ovozdan o'rganishi mumkin va modullilik tufayli istalgan son yoki bashorat kombinatsiyasini ishlab chiqaradi.

Machine Learning: EPFL-dan yanada moslashuvchan sun'iy intellekt uchun yangi multimodal model
EPFLdan ko'proq moslashuvchan sun'iy intellekt uchun yangi multimodal model (Surat: Brayan Penni/Pixabay)

Biz OpenAI yoki ChatGPT haqida gapiramizmi, chatbotlarning katta qismi generativ sun'iy intellekt deb atalmishlarga asoslanadi Katta til modeli (LLM), modellari chuqur o'rganish katta hajmdagi matn orqali ma'lumotni o'rganish orqali ularga berilgan savollarga javob berishga o'rgatilgan.

ning oxirgi chegarasiYaratgan A.I. ular multimodal modellar, bu yanada ilg'or tajriba va xizmatni taklif qilish uchun tilni tushunish va tasvirlar, video va audiolarni birlashtiradi.

Biroq, ularning yaratilishi, ayniqsa, kichik miqyosda multimodal modellarni yaratish niyatida bo'lsa, bir qator qiyinchiliklarni keltirib chiqaradi: tez-tez etishmayotgan ma'lumotlarning mavjudligi ma'lumotlarning mavjud emasligi, deyarli har doim resurslarning qisman mavjudligi sababli.

Xulosa qilib aytganda, tavakkalchilik shundaki, model kamchilik asosida o'rganadi va hisob-kitoblar va bashoratlar buzib tashlanadi. Va bu erda EPFL o'zining yangi loyihasini boshladi.

Lozanna va Tsyurix Texnik Universitetidan yashil energiya koalitsiyasi
3D-da virtual haqiqatni aniq qiladigan texnologik qo'lqop

Machine Learning
Lozannadagi Federal Politexnika Kampusi (Foto: Facebook/EFPL)

MultiModN, Lozannada tug'ilgan modulli multimodal model

Men ricercatori del Lozanna Federal Politexnika (EPFL), muhandislik va axborot texnologiyalari bo'yicha dunyodagi eng yaxshi universitetlardan biri, aslida rivojlangan MultiModN, yaqinda NeurIPS2023 da taqdim etilgan noyob modulli multimodal model.

EPFL kompyuter fanlari va kommunikatsiyalari maktabidagi Mashinalarni o'rganish (ML4ED) va Mashina o'rganish va optimallashtirish (MLO) laboratoriyalari tadqiqotchilari katta, ammo kichikroq miqyosda o'ylashning mutlaqo aksini ishlab chiqish va sinab ko'rishga qaror qilishdi.

O'qituvchi boshchiligida Meri-Ann Xartli, MLO va Yel tibbiyot maktabida birgalikda tashkil etilgan Global aqlli sog'liqni saqlash texnologiyalari laboratoriyasi direktori va professor Tanja Käser, ML4ED direktori, jamoa matn, tasvirlar, videolar va tovushlardan o'rganish mumkin bo'lgan multimodal modelni yaratdi, ammo mavjudlaridan farqli o'laroq, u quyidagilardan iborat. kichikroq modullarning o'zgaruvchan soni, avtonom va kirishga xos.

Ikkinchisi mavjud ma'lumotlarga asoslanib tanlanishi va keyin istalgan raqam, kombinatsiya yoki kirish turining ketma-ketligiga birlashtirilishi mumkin. Shuning uchun u bashoratlarning istalgan sonini yoki kombinatsiyasini ishlab chiqishi mumkin.

"Biz MultiModN ni baholadik o'nta haqiqiy faoliyattibbiy diagnostika, akademik samaradorlikni bashorat qilish va ob-havo prognozini qo'llab-quvvatlash, shu jumladan, tushuntirdi u Vinitra Swamy, ML4ED va MLO fan doktori talabasi va loyihaning birinchi hammuallifi.

"Ushbu tajribalar orqali biz MultiModN multimodal modellashtirish uchun birinchi o'z-o'zidan talqin qilinadigan va etishmayotgan ma'lumotlarga chidamli yondashuv ekanligiga ishonamiz.".

EPFLning kuchliroq kvant kompyuterlari uchun "retsepti"
Sun'iy intellektdan kriptovalyutalarga hal qiluvchi yordammi?

Machine Learning
EPFL Kompyuter fanlari va kommunikatsiyalari maktabi (Foto: Facebook/EPFL IC)

Birinchi foydalanish holati: tibbiy xodimlar uchun klinik qarorlar

MultiModN-dan birinchi foydalanish holati qo'llab-quvvatlash tizimi sifatida bo'ladi klinik qarorlar resurs cheklangan sharoitlarda tibbiy xodimlar uchun.

Sog'liqni saqlash sohasida, aslida, klinik ma'lumotlar ko'pincha yo'qoladi, ehtimol cheklangan resurslar tufayli (bemor ma'lum bir testni o'tkaza olmaydi) yoki aksincha, resurslar va ma'lumotlarning ko'pligi tufayli. MultiModN ushbu haqiqiy ma'lumotlardan o'zining noto'g'ri deb ataladigan ma'lumotlarini o'zlashtirmasdan o'rganishga qodir va bashoratlarni har qanday kombinatsiya yoki kirish soniga moslashtira oladi.

"Yo'qolgan ma'lumotlar resurslar cheklangan kontekstlarning o'ziga xos belgisidir va modellar ushbu etishmayotgan naqshlarni o'rganishi bilan ular o'zlarining bashoratlarida xatolarni kodlashlari mumkin " - deya ta'kidladi u Meri-Ann Xartli.

"Kutilmagan mavjud resurslar oldida moslashuvchanlik zarurati MultiModN-ni ilhomlantirgan narsadir.".

Eng muhimi, AI va mashinani o'rganishning xizmatlarga ta'siri
Raqamli san'atda sun'iy intellektning o'sib borayotgan ta'sirining barcha sabablari

Machine Learning
Tahlil laboratoriyasi (Surat: Mixal Jarmoluk/Pixabay)

Laboratoriyadan haqiqiy hayotga: pnevmoniya va sil kasalligi bo'yicha sud jarayoni davom etmoqda

Nashr, ammo amalga oshirish va dalada sinovdan o'tkazish yo'lidagi birinchi qadamdir. Professor Xartli Lozanna universiteti kasalxonasi (CHUV) va Bern universiteti kasalxonasi Inselspitaldagi hamkasblari bilan ish olib bordi. klinik tadqiqotlar Resurs cheklangan sharoitlarda pnevmoniya va sil kasalligini tashxislashga qaratilgan va minglab bemorlarni jalb qilish jarayonida. Janubiy Afrika, Tanzaniya, Namibiya e Benin.

Tadqiqot guruhlari keng qamrovli ta'lim tashabbusini, o'qitishni o'z zimmalariga oldilar 100 dan ortiq shifokorlar multimodal ma'lumotlarni, shu jumladan ultratovushli tasvirlar va videolarni muntazam ravishda to'plash, shuning uchun MultiModN kam resursli hududlardan haqiqiy ma'lumotlarga sezgir bo'lishga o'rgatiladi.

"Biz MultiModN ishlashga mo'ljallangan murakkab multimodal ma'lumotlarni to'playapmiz", dedi shifokor Noemi Boillat-Blanko, CHUV yuqumli kasalliklar bo'yicha mutaxassis.

“Biz buni qadrlay oladigan modelni ko'rishdan xursandmiz etishmayotgan resurslarning murakkabligi bizning kontekstimizda va muntazam klinik baholashlarning tizimli etishmasligi"- deya qo'shimcha qildi shifokor Kristina Keytel Shveytsariya poytaxtidagi Inselspital universitet shifoxonasi.

AI xavfsizligi? Bletchley Park bayonoti juda muhim
AI uchun Axel Springer-OpenAI o'qi jurnalistika xizmatida

EPFL innovatsiyasi maxsus tibbiy bilimlarga kirishni ta'minlash orqali klinik qarorlar qabul qilishni yaxshilash uchun mo'ljallangan (Foto: Irwan/Unsplash)

Mashinani o'rganish jamoat manfaati uchun xizmat qiladi

MultiModN-ni ishlab chiqish va o'qitish EPFLning mashinani o'rganish vositalarini haqiqatga va jamoat manfaatiga moslashtirishga qaratilgan sa'y-harakatlarini davom ettiradi va ishga tushirilgandan ko'p o'tmay keladi. Meditron, tibbiyot sohasi uchun maxsus ishlab chiqilgan sun'iy intellekt modeli.

Meditron shuningdek, katta til modellari (LLM) toifasiga kiradi, ammo keng ko'lamli vazifalarni bajaradigan umumiy modellardan farqli o'laroq, u quyidagilarga qaratilgan. tibbiyot sohasi, va hajmi jihatidan ancha ixcham, lekin bir xil darajada samarali.

Meditronning maqsadi tibbiy ma'lumotlarga kirishni demokratlashtirish yuqori sifatli, shuning uchun klinik qarorlarni qabul qilishga yordam beradi.

EPFL tadqiqotchilari mos ravishda 7 milliard va 70 milliard parametrli ikkita versiyani ishlab chiqdilar va modellar tanlangan, yuqori sifatli tibbiy ma'lumotlar manbalari, jumladan, ko'rib chiqilgan ilmiy adabiyotlar va turli klinik ko'rsatmalar bo'yicha o'qitildi, bu esa keng va aniq bilim bazasini ta'minlaydi.

2023-yil noyabr oyida taqdim etilgan Meditron ham, MultiModN ham EPFLning yangi sunʼiy intellekt markazining missiyasiga mos keladi, u masʼuliyatli va samarali sunʼiy intellekt jamiyatning barcha sohalari manfaati uchun texnologik innovatsiyalarni qanday targʻib qilishi mumkinligiga qaratilgan.

Millionlab batareyalarni tejashga qodir inqilobiy sensorlar
AI: boshlanadigan urush biz kutgandek bo'lmaydi ...

Machine Learning: EPFL-dan yanada moslashuvchan sun'iy intellekt uchun yangi multimodal model
Lozanna Federal Politexnika logotipi bilan EPFL kampusining tashqi ko'rinishi (Foto: Facebook/EFPL IC)