Sa.. Nov. 22nd, 2025
Strategien für die KI-Bereitstellung in 22 Sprachen

Vineet Sawant hat die letzten zwei Jahre damit verbracht, als Lieferfahrer auf einem Roller durch die geschäftigen Straßen von Mumbai zu navigieren.

„Unterwegs zu sein ist immer sehr stressig, besonders in Städten wie Mumbai“, bemerkt er.

Zu Beginn seiner Tätigkeit stellten Sprachbarrieren eine zusätzliche Hürde dar.

Als Muttersprachler des Marathi gibt Herr Sawant zu, „sehr wenig“ Englisch zu sprechen, und präzisiert: „Ich kann einiges verstehen, aber das Lesen ist sehr schwierig.“

Diese sprachliche Kluft stellte ihn vor Herausforderungen in seiner neuen Position.

„Am Anfang war es schwierig. Alles war auf Englisch, und obwohl ich einiges davon verstehen konnte, fühle ich mich in Marathi wohler. Ich habe oft andere Lieferfahrer um Hilfe gebeten, um meine Aufgaben zu verstehen“, erinnert er sich.

Sein Arbeitgeber Zepto, bekannt für sein Versprechen „Indiens schnellste Online-Lebensmittellieferung“, erkannte, dass es alles andere als ideal war, wenn Fahrer Schwierigkeiten mit den Lieferanweisungen hatten.

Um dieses Problem anzugehen, ging Zepto vor einem Jahr eine Partnerschaft mit Reverie Language Technologies ein und integrierte einen KI-Übersetzungsdienst für seine Fahrer.

Seitdem können die Fahrer innerhalb der Zepto-App aus sechs Sprachen wählen.

„Ich muss nicht mehr raten“, teilt Herr Sawant mit.

„Früher habe ich mehr Zeit mit Lesen verbracht und manchmal Fehler gemacht. Wenn ein Kunde jetzt ‚Klingel läuten‘ schreibt, erhalte ich diese Anweisung in Marathi. Ich muss nicht mehr fragen oder nachprüfen – es ist alles klar.“

Die Erfahrungen von Herrn Sawant sind in Indien keine Seltenheit.

„Indien verfügt über 22 offizielle Sprachen und Hunderte von Dialekten“, erklärt Professor Pushpak Bhattacharyya vom IIT Mumbai, ein führender Experte für die Anwendung von KI auf indische Sprachen.

Er betont: „Ohne Technologie, die in diesen Sprachen versteht und kommuniziert, sind Millionen von der digitalen Revolution ausgeschlossen – insbesondere in den Bereichen Bildung, Verwaltung, Gesundheitswesen und Bankwesen.“

Der Aufstieg generativer KI-Systeme wie ChatGPT hat diesen Bedarf noch dringlicher gemacht.

KI-Modelle werden mit riesigen Datenmengen trainiert, wie z. B. Webseiten, Büchern und Video-Transkripten.

Während diese Daten für weit verbreitete Sprachen wie Hindi und Englisch relativ leicht zu beschaffen sind, sind sie für andere spärlicher.

Professor Bhattacharyya merkt an: „Die größte Herausforderung bei der Erstellung indischer Sprachmodelle ist die Verfügbarkeit von Daten – verfeinerter Daten. Daten von grober Qualität sind verfügbar, müssen aber gefiltert werden, da sie nicht von sehr hohem Standard sind.“

„Das Problem in Indien ist, dass für viele indische Sprachen, insbesondere für Stammes- und regionale Dialekte, diese Daten einfach nicht existieren oder nicht digitalisiert wurden.“

Reverie Language Technologies setzt seine KI-gestützte Übersetzungstechnologie nun für eine Vielzahl indischer Unternehmen ein.

Mitbegründer Vivekananda Pani räumt ein, dass die Übersetzungstechnologie zwar die Kommunikation vereinfachen wird, aber auch die „Gefahr besteht, dass weniger verbreitete Dialekte verdrängt werden.“

„Die Herausforderung wird darin bestehen, sicherzustellen, dass die unglaublichen Vorteile der KI-gestützten Sprachfortschritte die reiche Vielfalt der menschlichen Sprache nicht unbeabsichtigt schmälern.“

Um dem entgegenzuwirken, hat Professor Bhattacharyya zu Bhashini beigetragen, einem Regierungsprojekt zur Entwicklung der hochwertigen Datensätze, die für das Training von KI-Modellen erforderlich sind.

Zusätzlich zu den Datensätzen hat Bhashini KI-Sprachmodelle und Übersetzungsdienste in 22 Sprachen entwickelt.

Das im Jahr 2022 gestartete Projekt ist ein ehrgeiziges Unterfangen, das bereits bedeutende Fortschritte gemacht hat.

Bhashini hostet derzeit 350 KI-basierte Sprachmodelle, die über eine Milliarde Aufgaben verarbeitet haben.

Mehr als 50 Regierungsabteilungen und 25 Landesregierungen arbeiten mit Bhashini zusammen.

So wird beispielsweise die Technologie von Bhashini in mehrsprachigen Chatbots für öffentliche Dienstleistungen eingesetzt und zur Übersetzung von Regierungsinitiativen in lokale Sprachen.

„Bhashini sichert Indiens sprachliche und kulturelle Repräsentation, indem es Indien-spezifische KI-Modelle aufbaut, anstatt sich auf globale Plattformen zu verlassen“, erklärt Amitabh Nag, CEO von Digital India, Bhashini Division.

Er geht davon aus, dass ländliche Nutzer innerhalb der nächsten zwei bis drei Jahre sprachgesteuerten Zugang zu staatlichen Dienstleistungen, Finanzinstrumenten und Informationssystemen in ihrer Muttersprache haben werden.

Es wird erwartet, dass diese auf Indien ausgerichteten Datensätze KI-Entwicklern die notwendigen Werkzeuge zur Anpassung ihrer Modelle für die gesamte Bevölkerung zur Verfügung stellen werden.

Derzeit kann die Entwicklung von KI-Programmen für komplexe Prozesse wie das Gesundheitswesen eine außergewöhnliche Herausforderung darstellen.

Kshitij Jadhav, ein außerordentlicher Professor am Koita Centre for Digital Health am IIT Mumbai, entwickelt ein KI-Programm, das Menschen beim Aufhören des Rauchens helfen soll.

Er erklärt, dass Personen in verschiedenen Phasen des Aufhörens unterschiedliche Ratschläge benötigen, was in der Regel einen ausgebildeten Fachmann für die Beurteilung erfordert.

Da jedoch nur eine begrenzte Anzahl von Fachkräften zur Verfügung steht, insbesondere solche, die mehrere Sprachen beherrschen, hofft Professor Jadhav, dass sein KI-Modell die Lücke schließen kann.

Die KI „wird zuerst die Art des Gesprächs identifizieren, das die Person benötigt, und wird dementsprechend Fragen formulieren, Empathie zeigen und Emotionen [ausdrücken]“, erklärt Professor Jadhav.

Letztendlich soll dies in 22 Sprachen verfügbar sein, wobei erste Experimente in Englisch und Hindi laufen.

„Es wird sehr individuell sein; es wird nicht einfach etwas von der Stange sein“, betont er.

Zurück in Mumbai hat Vineet Sawant seine täglichen Lieferungen von zehn auf rund 30 Pakete gesteigert, was zum Teil auf die Übersetzungsfunktion in der Liefer-App zurückzuführen ist.

Er glaubt, dass es vielen anderen wie ihm helfen wird.

„Es gibt uns das Gefühl, dazuzugehören. Nicht jeder versteht Englisch. Wenn die App unsere Sprache spricht, fühlen wir uns sicherer und arbeiten besser.“

Die USA werden ihre Abgabe auf chinesische Importe bei 30 % belassen, während China einen Zollsatz von 10 % auf amerikanische Waren beibehält.

Die Rettungsmaßnahmen an der Unglücksstelle werden durch starke Regenfälle und blockierte Straßen behindert.

Trumps unberechenbare Handelspolitik hat die Weltwirtschaft ins Chaos gestürzt und einige US-Preise erhöht.

Viele befürchten, dass sie die langjährige Unterstützung verlieren könnten, die die Gemeinschaft nach dem Ableben des derzeitigen Dalai Lama erhalten hat.

Die Chip-Giganten werden der US-Regierung Einnahmen zukommen lassen, im Austausch für Lizenzen für den Export nach China.

Von ProfNews