Google и Meta обновляют свои модели искусственного интеллекта на фоне развития AlphaChip

Это была чрезвычайно насыщенная неделя в новостях об искусственном интеллекте благодаря OpenAI, включая противоречивую публикацию в блоге генерального директора Сэма Альтмана, широкое внедрение расширенного голосового режима, слухи о центрах обработки данных 5GW, крупные кадровые встряски и драматические планы реструктуризации.

Но остальная часть мира искусственного интеллекта не движется в том же ритме, занимаясь своим делом и ежеминутно выпуская новые модели искусственного интеллекта и проводя исследования. Вот обзор некоторых других примечательных новостей об искусственном интеллекте за прошедшую неделю.

Обновления Google Gemini

Во вторник Google объявил об обновлениях своей модельной линейки Gemini, включая выпуск двух новых, готовых к производству моделей, основанных на предыдущих выпусках: Gemini-1.5-Pro-002 и Gemini-1.5-Flash-002. Компания сообщила об улучшении общего качества, а также о заметных улучшениях в математике, длительной обработке контекста и задачах визуализации. Google заявляет об увеличении производительности на 7 процентов в тесте MMLU-Pro и на 20 процентов при выполнении математических задач. Но, как вы знаете, если вы какое-то время читаете Ars Technica, тесты ИИ обычно не так полезны, как нам хотелось бы.

Наряду с обновлением модели Google существенно снизила цену на Gemini 1.5 Pro, сократив стоимость входных токенов на 64 процента и стоимость выходных токенов на 52 процента для подсказок менее 128 000 токенов. Как отметил в своем блоге исследователь искусственного интеллекта Саймон Уиллисон: «Для сравнения, GPT-4o в настоящее время стоит 5 долларов США за штуку.[million tokens] вход и 15 долларов на выход, а Claude 3.5 Sonnet — вход 3 доллара на миллион и выход 15 долларов на миллион. Gemini 1.5 Pro уже был самой дешевой из передовых моделей, а теперь стал еще дешевле».

Google также увеличил лимиты скорости: Gemini 1.5 Flash теперь поддерживает 2000 запросов в минуту, а Gemini 1.5 Pro обрабатывает 1000 запросов в минуту. Google сообщает, что последние модели обеспечивают вдвое большую скорость вывода и в три раза меньшую задержку по сравнению с предыдущими версиями. Эти изменения могут сделать для разработчиков более простым и экономичным создание приложений с помощью Gemini, чем раньше.

Мета запускает Llama 3.2

В среду Meta объявила о выпуске Llama 3.2, значительном обновлении своей линейки моделей искусственного интеллекта с открытым весом, о которых мы подробно рассказывали в прошлом. Новая версия включает в себя большие языковые модели (LLM) с поддержкой машинного зрения и размерами параметров 11 миллиардов и 90 бит, а также облегченные текстовые модели с параметрами 1B и 3B, предназначенные для периферийных и мобильных устройств. Meta утверждает, что модели машинного зрения конкурируют с ведущими моделями с закрытым исходным кодом в задачах распознавания изображений и визуального понимания, в то время как модели меньшего размера, как сообщается, превосходят конкурентов аналогичного размера в различных текстовых задачах.

Уиллисон провел несколько экспериментов с некоторыми меньшими моделями 3.2 и сообщил о впечатляющих результатах для моделей такого размера. Исследователь искусственного интеллекта Итан Моллик продемонстрировал запуск Llama 3.2 на своем iPhone с помощью приложения PocketPal.

Meta также представила первые официальные дистрибутивы «Llama Stack», созданные для упрощения разработки и развертывания в различных средах. Как и в случае с предыдущими выпусками, Meta делает модели доступными для бесплатной загрузки с лицензионными ограничениями. Новые модели поддерживают длинные контекстные окна до 128 000 токенов.

AlphaChip AI от Google ускоряет разработку чипов

В четверг Google DeepMind объявила о значительном прорыве в разработке электронных чипов на базе искусственного интеллекта AlphaChip. Он начался как исследовательский проект в 2020 году и теперь представляет собой метод обучения с подкреплением для проектирования макетов микросхем. Сообщается, что Google использовала AlphaChip для создания «сверхчеловеческих макетов микросхем» в последних трех поколениях своих тензорных процессоров (TPU), которые представляют собой чипы, похожие на графические процессоры, предназначенные для ускорения операций искусственного интеллекта. Google утверждает, что AlphaChip может создавать высококачественные макеты микросхем за несколько часов, а не недель или месяцев человеческих усилий. (Сообщается, что Nvidia также использует искусственный интеллект для разработки своих чипов.)

Примечательно, что Google также опубликовала на GitHub предварительно обученную контрольную точку AlphaChip, поделившись с общественностью весами моделей. Компания сообщила, что влияние AlphaChip уже распространилось за пределы Google: компании-разработчики чипов, такие как MediaTek, внедряют и развивают эту технологию для своих чипов. По данным Google, AlphaChip положил начало новому направлению исследований в области искусственного интеллекта для проектирования чипов, потенциально оптимизируя каждый этап цикла проектирования чипов, от компьютерной архитектуры до производства.

Это было еще не все, что произошло, но это некоторые основные моменты. Поскольку в настоящее время индустрия искусственного интеллекта не демонстрирует никаких признаков замедления, посмотрим, как пойдет на следующей неделе.

Новости Blue 789

Обновления Google Gemini

Мета запускает Llama 3.2

AlphaChip AI от Google ускоряет разработку чипов

Leave a Reply Cancel reply