Поддержать нас
Беларусы на войне
  1. ЦИК Армении огласил предварительные результаты парламентских выборов
  2. У одного дома висела «Пагоня», другого уволили за разговор с протестующими. Как сложились судьбы руководителей беларусского КГБ
  3. В сборной Беларуси по футболу появился самый возрастной в истории дебютант. Его присутствие помогло одержать третью подряд победу
  4. Тихановская и Зеленский поздравили Пашиняна с победой на выборах. Минск молчит — зато высказалась Россия
  5. Вводят новшества по земельным участкам и недвижимости — власти пояснили, что и для кого изменилось
  6. Для населения вводят новое ограничение — но в этом году были и другие. Вскоре могут появиться еще ужесточения
  7. На рынке валют перемены: доллар начал расти. Прогноз: чего ждать от курсов дальше?
  8. Синоптики сделали предупреждение из-за предстоящей погоды в понедельник — есть смысл ознакомиться с прогнозом
  9. В Беларуси ввели лимит задолженности на балансах абонентов сотовой связи
  10. На «Беларусьфильме» запускают новое кино. Есть повод для оптимизма
  11. Известный производитель обуви недавно попал в «реанимацию» — за это время ему стало хуже. Появились новые подробности
  12. Олигарх, который в 2020-м выступил против насилия, после встречи с Лукашенко рассказал о новом проекте в Беларуси
  13. Глава проблемного предприятия в Минске пожаловалась на то, как работают беларусы. Посмотрели зарплаты там — есть чему поразиться
  14. «Кошмар. Нет слов, одни маты». В одном из крупных беларусских городов люди занимают очередь в ГАИ с вечера
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.