Въведение
Google, дъщерната компания на Alphabet Inc., обяви в сряда пускането на своя „най-компетентен“ и най-голям модел на изкуствен интелект, известен като Gemini (Generalized Multimodal Intelligence Network).
Gemini, според официалното съобщение на компанията, е „създаден от нула, за да бъде мултимодален“, позволявайки му да обобщава и разбира различни видове информация, включително текст, код, аудио, изображения и видео.
Гъвкав и мултиразмерен
Gemini се описва като „най-гъвкавият модел“, способен да работи както с центрове за данни, така и с мобилни устройства. Моделът ще бъде представен в три различни варианта:
- Gemini Ultra: Най-голямата и най-способна категория.
- Gemini Pro: Покриващ широк спектър от задачи.
- Gemini Nano: Използван за специфични задачи и мобилни устройства.
Bard с обновена версия на Gemini Pro
Освен това, говорителният генеративен чатбот Bard, разработен от Google, ще използва „фино настроена версия на Gemini Pro“. Това представлява най-значимата актуализация на чатбота на технологичния гигант.
Достъп и лицензиране
От 13 декември разработчиците и корпоративните клиенти ще имат достъп до Gemini Pro чрез Gemini API в Google AI Studio или Google Cloud Vertex AI. Разработчиците на Android ще могат да използват Gemini Nano за изграждане на функции. Компанията планира да предлага лицензи за Gemini на клиенти чрез Google Cloud за интеграция в техните приложения.
Gemini също ще се използва за захранване на продукти на Google като чатбота Bard и Search Generative Experience. SGE все още не е широко достъпен, но се опитва да отговаря на заявки за търсене с текст в разговорен стил.
Още новини за Google ще откриете тук.