Компанія xAI, заснована Ілоном Маском, представила значне оновлення для свого чат-бота Grok, впровадивши новий голосовий режим Voice Mode та революційну функцію Grok Vision, що дозволяє користувачам взаємодіяти з навколишнім світом через камеру смартфона. Ці інновації наближають Grok до функціональних можливостей відомих конкурентів, таких як ChatGPT від OpenAI та Google Gemini.
За даними офіційного повідомлення від xAI, тепер Grok здатен інтерпретувати те, що бачить камера телефону, та надавати релевантні відповіді в реальному часі. Користувачі iPhone можуть просто навести камеру на будь-який об’єкт, поставити питання “Що я бачу перед собою?” і отримати контекстуальну відповідь через голосовий інтерфейс.
“Ми розробили Grok Vision, щоб зробити взаємодію зі штучним інтелектом більш природною та інтуїтивною”, — зазначається у прес-релізі компанії. “Тепер користувачі можуть отримувати інформацію про навколишній світ без необхідності вводити складні запити вручну”.
Функціонал Grok Vision вже став доступним для користувачів iOS через оновлення додатку в App Store. Варто зазначити, що власники пристроїв на базі Android поки що змушені чекати — компанія обіцяє впровадити ці функції для платформи Google “найближчим часом”, проте конкретних термінів не називає.
Окрім візуального розпізнавання, оновлений Voice Mode тепер підтримує багатомовне аудіо, дозволяючи користувачам спілкуватися з Grok різними мовами. Це суттєво розширює аудиторію потенційних користувачів сервісу та робить його більш доступним для людей з різних країн. Згідно з MacRumors, на даний момент підтримуються більше 10 мов, включаючи українську.
Ще однією важливою функцією, яка з’явилася в оновленні, є інтеграція пошуку в реальному часі. Тепер Grok може надавати актуальні відповіді, що відображають найсвіжішу інформацію з інтернету. Це дозволяє користувачам отримувати точні дані про поточні події, новини або будь-які інші питання, що вимагають актуальної інформації.
Нові покращення з’явилися незабаром після нещодавнього впровадження функції пам’яті Grok, про яку компанія повідомила минулого тижня. Ця функція дозволяє чат-боту запам’ятовувати попередні взаємодії, включаючи уподобання користувачів та раніше поставлені запитання, для надання більш персоналізованих відповідей та пропозицій.
“Функція пам’яті робить спілкування з Grok більш персоналізованим. Наш ШІ тепер може ‘запам’ятовувати’ важливу інформацію з попередніх розмов та використовувати її для формування відповідей, що найкраще відповідають вашим потребам”, — пояснюють розробники.
Варто зазначити, що xAI також нещодавно випустила першу версію Studio — робочого простору для створення документів та коду, подібного до Canvas від ChatGPT. Studio відкривається в окремому вікні та призначена для надання користувачам більш зосередженого середовища для створення контенту.
“Studio — це потужний інструмент для роботи з текстом та кодом. Ми прагнули створити середовище, де користувачі можуть максимально розкрити потенціал Grok для творчих та технічних завдань”, — зазначається в повідомленні компанії.
Експерти галузі вважають, що ці оновлення є важливим кроком у конкурентній боротьбі xAI з іншими розробниками систем штучного інтелекту. Новий функціонал суттєво розширює можливості Grok та робить взаємодію з ним більш природною та зручною.
“xAI активно працює над тим, щоб зробити Grok більш конкурентоспроможним порівняно з продуктами від OpenAI та Google. Впровадження функцій зору та покращеного голосового режиму — це значний крок уперед”, — коментують аналітики технологічного ринку в MacRumors.
За словами представників компанії, нові функції доступні як для передплатників преміум-версії Grok, так і для користувачів безкоштовного тарифу, хоча останні матимуть певні обмеження щодо кількості запитів.
Джерело: MacRumors: Grok AI Gains Vision and Voice Features in iOS App
А вам уже довелося випробувати нові можливості Grok AI? Поділіться своїми враженнями від використання функцій Grok Vision та Voice Mode в коментарях нижче!