Google та консорціум африканських дослідницьких інституцій запустили набір даних WAXAL — масштабну нову ініціативу для вирішення однієї з основних проблем штучного інтелекту (ШІ) на континенті: його нездатності інтерпретувати та розуміти більшість африканських мов.
Проєкт надає великий відкритий набір мовленнєвих даних, що охоплює 21 мову Африки на південь від Сахари, і відкриває голосові технології для понад 100 мільйонів людей, виключених з економіки ШІ.
Набір даних WAXAL є результатом трирічної співпраці, профінансованої Google та очолюваної місцевими університетами та громадськими групами.
Він включає 1 250 годин транскрибованого природного мовлення та понад 20 годин студійних записів, спрямованих на створення високоякісних синтетичних голосів. Він охоплює такі мови, як хауса, йоруба, луганда, ігбо та ачолі, багато з яких використовують десятки мільйонів людей, але які залишаються значною мірою невидимими для комерційних мовленнєвих систем.
Незважаючи на всі розмови про глобальний ШІ, голосові технології все ще значною мірою орієнтуються на англійську та невелику кількість європейських і азійських мов. Африка, де проживає понад 2 000 мов, залишилася на узбіччі.
Цей розрив не є академічним; він визначає, хто може користуватися цифровими послугами, хто має доступ до освітніх і медичних інструментів і хто може створювати компанії на основі сучасних платформ ШІ. Google представила цю роботу як крок до скорочення тривалого розриву в даних, який тримав багато африканських мов поза голосовими асистентами та іншими інструментами.
Окрім безпосереднього усунення цього дисбалансу, проєкт має таке ж значення, як і самі дані.
На відміну від попередніх ініціатив, де африканські мовленнєві дані витягувалися та належали іншим, WAXAL очолювали африканські інституції на місцях. Університет Макерере в Уганді, Університет Гани та Digital Umuganda в Руанді здійснювали нагляд за збором даних, залученням громадськості та управлінням мовами за технічної підтримки Google Research Africa.
Важливо, що ці інституції зберігають право власності на дані. Це помітний зсув у галузі, яку часто критикують за відтворення видобувної динаміки під прапором відкритості.
За словами Аїші Уолкотт-Браянт, голови Google Research Africa, "Остаточний вплив WAXAL полягає в розширенні можливостей людей в Африці. Цей набір даних забезпечує критичну основу для студентів, дослідників та підприємців для створення технологій на власних умовах, їхніми власними мовами, нарешті охоплюючи понад 100 мільйонів людей".
"Ми з нетерпінням чекаємо, коли африканські новатори використають ці дані для створення всього — від нових освітніх інструментів до голосових сервісів, які створюють відчутні економічні можливості по всьому континенту", — додала вона.
Аїша Уолкотт-Браянт, голова Google Research Africa
Це формулювання підтримують залучені університети. Джойс Накатумба-Набенде, старший викладач Університету Макерере, сказала:
"Щоб ШІ мав реальний вплив в Африці, він повинен говорити нашими мовами та розуміти наші контексти. Набір даних WAXAL надає нашим дослідникам високоякісні дані, необхідні для створення мовленнєвих технологій, які відображають наші унікальні спільноти. В Уганді це вже зміцнило наш місцевий дослідницький потенціал та підтримало нові проєкти, очолювані студентами та викладачами".
В Університеті Гани асоційований професор Ісаак Віафе вказав на масштаб громадської участі:
"Для нас в Університеті Гани вплив WAXAL виходить за межі самих даних. Це дало нам змогу створити власні мовні ресурси та навчити нове покоління дослідників ШІ. Понад 7 000 волонтерів приєдналися до нас, тому що хотіли, щоб їхні голоси та мови належали до цифрового майбутнього. Сьогодні ці колективні зусилля запустили екосистему інновацій у таких галузях, як охорона здоров'я, освіта та сільське господарство. Це доводить, що коли дані існують, можливості розширюються скрізь".
Є підстави для обережного оптимізму. Відкриті набори мовленнєвих даних можуть знизити бар'єри для місцевих стартапів і дослідників, яким не вистачає ресурсів для збору даних у масштабі. Вони також можуть зменшити залежність від іноземних API, які рідко підтримують африканські мови належним чином, якщо взагалі підтримують.
Набір даних WAXAL
Проте набори даних не гарантують результатів; створення надійних голосових систем вимагає постійних інвестицій, локального розгортання та комерційних шляхів, які зберігають цінність у країні. Роль Google як фінансуючої сторони та організатора викличе увагу, особливо щодо того, як дані WAXAL використовуватимуться глобальними компаніями в майбутньому.
Наразі випуск набору даних WAXAL є конкретним кроком до більш лінгвістично інклюзивної екосистеми ШІ. Це не вирішує проблем ШІ в Африці, але вирішує фундаментальну. Голос часто є найприроднішим інтерфейсом з технологіями. Забезпечити, щоб ШІ міг почути, як говорить Африка, в усьому її різноманітті, давно назріло.
Допис Google навчатиме ШІ 21 африканській мові, включаючи йорубу, хаусу та ігбо вперше з'явився на Technext.


