Afrikas Entwickler wollen KI-Lücke für „low-resource languages“ schließen

Für Milliarden von Menschen im globalen Süden, die keine verbreiteten Sprachen sprechen, sind KI-Tools wie ChatGPT und Google Translate nutzlos. Forscher und Startups in Afrika und anderen Erdteilen wollen das ändern.

„Selbst maschinelle Übersetzungen sind in meiner Sprache nicht möglich“, klagt Mekdes Gebrewold, Gründerin des Beratungsunternehmens Ashagari in Äthiopiens Hauptstadt Addis Abeba. „Tools wie Google Translate sind für Amharisch nicht gut geeignet. Also bezahlen wir stattdessen für professionelle Übersetzer.“

Äthiopiens Landessprache Amharisch macht zusammen mit allen anderen afrikanischen, amerikanischen und ozeanischen Sprachen weniger als 0,1 Prozent des Datenbestands aus. Es wird als „low-resource language„, als Sprache mit geringen Ressourcen bezeichnet, für die nur wenige digitale Daten verfügbar sind. Dennoch werden diese Sprachen von Milliarden von Menschen gesprochen. Selbst Sprachen mit zahllosen Sprechern, wie Hindi, Arabisch und Bengali zählen dazu.

Asmelash Teka Hadgu gehört zu den Gründern von Lesan, einem Startup, der maschinelle Übersetzungs- und Sprachtechnologie für die äthiopischen Sprachen Amharisch und Tigrinya entwickelt. Sein Team hat keinen Zugriff auf große Mengen an Online-Ressourcen, sondern arbeitet direkt mit der Gemeinschaft zusammen, um kreative Wege für die Sammlung von Daten zu finden.

„Wir arbeiten hauptsächlich mit Studenten, die ihre Sprache einfach lieben“, erklärt er der DW. „Wenn wir ihnen erzählen, dass wir dieses System entwickeln, fühlen sie sich inspiriert und wollen dazu beitragen. Also stellen wir Aufgaben, um Inhalte in unserer Sprache zu sammeln. Wir unterstützen sie und belohnen sie auch finanziell.“

Das erfordert eine Menge manueller Arbeit. Zunächst werden hochwertige Datensätze identifiziert, also zum Beispiel vertrauenswürdige Bücher oder Zeitungen. Diese werden dann digitalisiert und in die Zielsprachen übersetzt. Schließlich werden das Original und die Übersetzung für den maschinellen Lernprozess Satz für Satz abgeglichen.

Quelle: Deutsche Welle

Branchen
Einsatzfelder
Wertschöpfungsaktivitäten
Technologiefelder

Die Informationen zu den KI-Projekten sind unverbindlich. Wir übernehmen keine Garantie für Richtigkeit oder Vollständigkeit. Wir laden Sie herzlich dazu ein, uns jederzeit Projekte und Anfragen per E-Mail zu senden. Wir schätzen Ihr Feedback und sind offen für Ideen. Kontakt: info@cyberlago.net.