Facebook опублікував АІ-модель "Segment Anything", яка може виявляти об'єкти на фотографіях і відео, навіть якщо ніколи їх не бачила. Про це компанія повідомила на своєму сайті.
Ви можете вибирати об'єкти, натискаючи на них або використовуючи текстові підказки у вільній формі. Наприклад, ви можете ввести слово "кіт" і побачити, як ШІ виділить усіх котячих на фото.
Модель також може працювати в тандемі з іншими моделями. Вона може допомогти реконструювати об'єкт у 3D, використовуючи одне зображення, або намалювати його за допомогою гарнітури змішаної реальності. По суті, Segment Anything може обмежити потребу в додатковому навчанні ШІ.
Як модель ШІ, так і набір даних можна буде завантажити з некомерційною ліцензією. Тобто творці не зможуть використовувати їх для створення продуктів. Це в першу чергу для досліджень і розширення доступу до технології. Зараз Meta використовує дещо схожу технологію для модерації забороненого контенту, рекомендацій дописів та тегування фотографій.
Розробники визнають, що чинна модель недосконала. Вона може пропускати дрібні деталі і не так точно визначає межі, як деякі моделі. І хоча Segment Anything може обробляти підказки в режимі реального часу, вона гальмує, коли йдеться про складну обробку зображень.
Такі моделі можуть допомогти в ситуаціях, коли непрактично покладатися виключно на навчальні дані. Соціальна мережа могла б використовувати цю технологію, щоб не відставати від обсягу контенту, що швидко зростає. Це свідчить про те, що Meta хоче узагальнити комп'ютерний зір.
Ярослав Жахалов
e-news.com.ua