11.ai від ElevenLabs: голосовий асистент, що розмовляє як людина (і хоче стати вашим Джарвісом)

.. але не стане :)

Компанія ElevenLabs, яка спеціалізується на неймовірно реалістичному синтезі голосу (їх технологію справедливо називають однією з найкращих у цій галузі), запустила новий сервіс - персонального голосового асистента 11.ai.

Як великий фанат їхнього застосунку ElevenReader для прослуховування аудіокнижок (цей текстовий «читалка» вже має мільйони користувачів по всьому світу), я з величезною цікавістю протестував 11.ai. Результат? Голосовий асистент, що дійсно говорить зі мною як жива людина, і кілька цікавих відкриттів, якими я хочу поділитися. Не всі з них позитивні.

Що таке 11.ai і навіщо він потрібен?

11.ai – це новітній голосовий AI-асистент від ElevenLabs, створений спеціально для підвищення продуктивності. На відміну від звичайних помічників типу Siri (епл, прокидайся вже…) або Alexa, які обмежені простими відповідями, 11.ai намагається виконувати корисні дії у вашому робочому процесі. Замість простої балаканини, цей асистент може інтегруватися з вашими улюбленими інструментами і діяти за запитом голосу. Наприклад, ви можете сказати щось на кшталт: «Плануй мій день і додай пріоритетні задачі в Notion» або «Перевір нові повідомлення в Slack та відправ команді мій апдейт» – і 11.ai спробує це зробити, підключившись до відповідних сервісів. Ну а спершу ви самі маєте їх підключити.

Він вміє синхронізувати задачі з календарем чи Notion, шукати інформацію через Perplexity, працювати зі Slack і створювати тікети в Linear – усе голосовими командами.

Працює це так: ви звертаєтеся до 11.ai голосом, він розпізнає вашу мову, аналізує команду і за допомогою MCP (Model/Multi-Channel Protocol) виконує дію у підключеному додатку. ElevenLabs дозволяє обрати з понад 5000 голосів або навіть створити клон свого власного голосу для максимального відчуття присутності. Асистент відповідає людяним, плавним голосом, тож спілкування з ним відчувається інтуїтивно і невимушено. Коли я вперше запитав 11.ai про погоду та плани на день, мені здалося, ніби колега відповідає по телефону – настільки природною була інтонація. До речі, ElevenLabs підтримує понад 70 мов і автоматично розпізнає мову користувача. Тож я був приємно здивований, коли асистент заговорив до мене українською без жодних додаткових налаштувань.

Плюси 11.ai: що мені сподобалося

  • Неймовірно реалістичний голос. ElevenLabs недарма очолюють індустрію AI-озвучки – голоси звучать живими, емоційними та виразними, краще за більшість конкурентів. Моєму здивуванню не було меж: асистент не монотонно зачитує текст, а говорить із інтонаціями, паузами і навіть емоціями. Здається, ніби спілкуєшся з реальною людиною, а не зі штучним інтелектом.

  • Інтеграції. 11.ai задуманий як голосовий productivity-асистент, отже головна його фішка – інтеграції з робочими інструментами. Я тестував на Perplexity - і… саме таким я хотів би бачити голосове спілкування з Perplexity. Ми мило потеревенили про скіфів та сарматів. У перспективі, чим більше підключень до ваших улюблених застосунків, тим кориснішим стане 11.ai. Фактично, потенціал величезний: від автоматизації рутини до справжнього “секретаря”, який за голосовою командою і листа напише, і звіт підготує.

  • Легкість використання і формат “hands-free”. Інтерфейс 11.ai наразі веб-орієнтований і доволі простий. Ти тиснеш кнопку і говориш. Асистент швидко (не завжди) аналізує і відповідає голосом. Ніякого набору тексту, вільні руки – можна робити зарядку чи готувати каву, поки 11.ai зачитує вам ранковий дайджест новин чи розклад зустрічей. До речі, розробники планують додати режим, коли можна надрукувати питання, а асистент відповість вголос. Це стане в пригоді, якщо ви в офісі і не хочете виглядати дивно, розмовляючи з ноутбуком в голос. Я особисто чекаю на такий режим – інколи треба тихо отримати інформацію, щоб не привертати уваги колег.

Мінуси 11.ai: над чим ще працювати

Звісно, 11.ai поки що в альфа-версії, і деякі недоліки очікувані. Ось що мене і спільноту ентузіастів бентежить найбільше:

  • Немає доступу до історії розмов. Це просто фіаско. Все, коли я оце зрозумів - захотілось закрити і забути про сервіс. Чи то я досліджував щось, чи задачу ставив - воно десь там сталося. Найбільший мінус, який я виявив: все, про що ви говорите з асистентом, залишається тільки в поточній сесії. Після завершення розмови або оновлення сторінки (!) – прощай, історіє. Ні переглянути минулі діалоги, ні скопіювати текст відповіді асистента неможливо. Це засмучує, адже інколи він видає корисні поради чи списки, які хочеться зберегти. На Reddit користувачі вже запитують ElevenLabs, як видалити або хоча б побачити історію чатів, але поки що такої функції немає (представник команди відповів, що «ми впровадимо цю можливість зовсім скоро»). Сподіваюсь, з часом з’явиться повноцінний журнал розмов або хоча б кнопка для копіювання останньої відповіді. Бо зараз відчуття таке, що говориш в ефір – відповіді звучать, але сліду від них не лишається.

Зверніть увагу на пункт з MCP - це може бути цікаво.

  • Обмежений набір інтеграцій наразі. Хоч 11.ai і вміє конектитись до різних сервісів, зараз список підтримуваних інтеграцій не надто довгий. Поза коробкою доступні лише кілька популярних інструментів (Linear, Notion, Slack, Perplexity тощо). Якщо ви користуєтесь чимось екзотичним або корпоративним, доведеться зачекати або налаштовувати власний MCP-сервер. Фактично, користь асистента прямо пропорційна тому, наскільки він “вміє” працювати з вашим софтом. І тут є пункт з МСР, що відкриває широкі горизонти.

  • Питання ціни в майбутньому. Наразі 11.ai безкоштовний на час альфа-тесту, чим я не забув скористатися. Проте всі ми знаємо, що безкоштовні обіди не тривають вічно. ElevenLabs – комерційна компанія, їхній ElevenReader колись теж стартував безкоштовно, а потім отримав платні тарифи. І вони такі, відверто, кусючі! Дехто з користувачів вже жартує, мовляв «зараз закохаєтесь, а потім з вас візьмуть гроші, як і за ElevenReader». В бізнес-планах ElevenLabs вже закладена вартість ~$0.10 за хвилину роботи асистента.

Висновки: чи стане 11.ai моїм особистим асистентом?

Мені пропонують створити другого асистента, хоча я так і не зрозумів навіщо.

Якщо коротко - НІТ 🙂 

Після кількох днів спілкування з 11.ai я відчув себе трохи Тоні Старком, що розмовляє з власним J.A.R.V.I.S. 😄. Асистент від ElevenLabs дійсно вражає надзвичайно живим голосом.

Все це красиво, але це не мій особисто формат роботи з інструментами продуктивності - мені не вистачає елементарного контролю. Більшість задач в todoist я заношу руками. І роблю це не тому, що не можу зробити атвомтаизації. Для мене це спосіб контролю. Бо вартість того, що сирий асистент занесе не на ту дату чи відправить листа не тій особі - дуже висока. Особливо, коли ви про це навіть не знаєте - бо в 11 є лише голос.

Я згадую першу хвилю голосових асистентів, як Amazon інтвестував в розробників різних флоу до Echo. Але все то скрутилося до “яка там погода“ і “включи мені хор “Гомін“, благаю“. Бо голосовий інтерфейс має дуже обмежені можливості в UX. Може це мої такі базові налаштуваннея - людини з аналогового минулого, може у вас інакше.

Іще один великий мінус - воно якось “не по-людськи“ зроблено в плані інтеграцій. Тобто я би очікував що 11 буде інтегровано в пошту, а не навпаки. Хоча, хто їх туди пустить, коли місце намолене під Gemini.

Чи варто пробувати? Так, принаймні щоб отримати кайф від голосу. Він реально кращий на ринку.