Überbrückung der digitalen Kluft durch sprachliche Vielfalt
- Anna Mae Yu Lamentillo

- 29. Okt. 2024
- 3 Min. Lesezeit
Als MSc-Studentin im Major Programme Management an der Saïd Business School der University of Oxford konzentriert sich meine Forschung auf eine der dringendsten Herausforderungen des digitalen Zeitalters: die Überbrückung der digitalen Kluft durch die Verbesserung der Fähigkeiten der natürlichen Sprachverarbeitung (Natural Language Processing, NLP) für ressourcenschwache Sprachen mit komplexer Morphologie. Für Milliarden von Menschen ist der Zugang zu digitalen Werkzeugen in ihrer Muttersprache begrenzt oder gar nicht vorhanden. Diese Lücke verstärkt soziale und wirtschaftliche Ungleichheiten und erschwert den Zugang zu grundlegenden Dienstleistungen – insbesondere in Regionen, in denen Sprachen komplex sind, aber digital kaum repräsentiert werden, wie etwa auf den Philippinen oder in vielen Ländern Afrikas. Mit meiner Arbeit möchte ich untersuchen, wie auf diese Sprachen zugeschnittene NLP-Systeme als Brücke zu digitaler Inklusion und wirtschaftlichen Chancen für marginalisierte Gemeinschaften dienen können.
Ressourcenschwache Sprachen weisen oft einzigartige Merkmale auf, die herkömmliche NLP-Modelle – entwickelt für ressourcenstarke Sprachen wie Englisch oder Spanisch – nicht erfassen können. Sprachen wie Tagalog, Yoruba und Twi besitzen eine komplexe Morphologie, Grammatikstrukturen und kulturelle Nuancen, die von Standardmodellen nicht adäquat berücksichtigt werden. Diese Unterrepräsentation ist besonders ausgeprägt in Regionen wie Afrika und Südostasien, wo die sprachliche Vielfalt enorm ist. Ohne geeignete NLP-Modelle stoßen Sprecher dieser Sprachen auf zusätzliche Hürden in der digitalen Alphabetisierung und werden so von Bildung, Gesundheitsversorgung und bürgerschaftlichem Engagement ausgeschlossen, die über digitale Kanäle zugänglich sind.
Ein zentraler Bestandteil meiner Forschung wird darin bestehen, zu untersuchen, wie künstliche Intelligenz (KI) darauf trainiert werden kann, sprachliche und datenbezogene Herausforderungen zu bewältigen, die für ressourcenschwache Sprachen einzigartig sind. Dieser Fokus steht in direktem Zusammenhang mit der Mission meines Startups NightOwlGPT – einer Plattform, die speziell entwickelt wurde, um marginalisierte Sprachen zu unterstützen. NightOwlGPTs Ansatz, der auf den Philippinen mit Sprachen wie Tagalog und Cebuano begann und sich nun auf Länder in Afrika ausweitet, legt den Schwerpunkt auf Sprachbewahrung und Zugänglichkeit. Durch die Einbindung unterrepräsentierter Sprachen zeigt NightOwlGPT, wie KI sinnvolle Verbindungen zwischen Menschen und digitalen Ressourcen in ihrer Muttersprache schaffen kann – und damit soziales sowie wirtschaftliches Wachstum in benachteiligten Gemeinschaften fördert.
Die Herausforderung ist groß. Sprecher ressourcenschwacher Sprachen – darunter Millionen in den Philippinen, Ghana, Kenia und Nigeria – sind oft auf mündliche Überlieferung angewiesen, die ohne digitale Erfassung vom Verschwinden bedroht ist. Meine Forschung wird auf der Arbeit von Plattformen wie NightOwlGPT aufbauen, indem sie Techniken zur Datenerhebung und -strukturierung untersucht, die diese Sprachen möglichst genau abbilden. Afrikanische Sprachen enthalten beispielsweise häufig tonale Unterschiede, bei denen sich die Bedeutung je nach Tonhöhe verändert, während philippinische Sprachen Affixe verwenden, die den Wortstamm mit Bedeutungsebenen anreichern. Eine KI, die diese sprachlichen Feinheiten erfassen kann, ermöglicht nicht nur präzisere NLP-Tools, sondern trägt auch zur kulturellen Bewahrung bei.
Dieses Thema geht über reine Technologie hinaus – es geht um den Aufbau einer inklusiven digitalen Welt, in der alle Sprachen berücksichtigt werden. Wenn wir NLP-Modelle darauf trainieren, ressourcenschwache Sprachen zu verstehen, schließen wir nicht nur eine technologische Lücke, sondern fördern auch digitale Gerechtigkeit. So können vielfältige Gemeinschaften aktiv am digitalen Wandel teilhaben. An der Saïd Business School möchte ich mit meiner Forschung diese Lücke sichtbar machen und dazu beitragen, sie zu schließen – für eine digitale Zukunft, in der sprachliche Vielfalt bewahrt und gefeiert wird. KI hat das Potenzial, transformativ für alle Gemeinschaften zu wirken. Mit verbesserten NLP-Modellen für ressourcenschwache Sprachen können wir sicherstellen, dass wirklich jede Stimme im digitalen Zeitalter Gehör findet.




