6. mars, 2026

Habibi: Den kinesiske KI-en som mesterer alle de arabiske dialektene

Share

Forskere i Shanghai har utviklet den første modellen for kunstig intelligens som kan syntetisere tale på mer enn tyve arabiske dialekter.

Verktøyet kalles Habibi og er tilgjengelig med åpen kildekode;  målet er å fylle et stort tomrom i den globale forskningen på språkbehandling. Samtidig bidrar det til å styrke Kinas teknologiske innflytelse i Midtøsten.

Forskere ved X-LANCE-laboratoriet ved Shanghai Jiao Tong-universitetet har nylig publisert Habibi – «min kjære» på arabisk – den første modellen med åpen kildekode for talesyntese (det vil si tekst-til-tale/TTS) som er teknologi der skrevet tekst konverteres til kunstig, menneskeliknende tale på digitale enheter, red.anm.) som forener mer enn tyve arabiske dialekter i ett og samme KI-system. Publiseringen på plattformen arXiv er en verdensnyhet som kan endre forholdet mellom kunstig intelligens og den arabisktalende verden.

Det er meget omfattende utfordring. Moderne standard-arabisk som er det offisielle og skriftlige språket, brukes i liten grad i dagligtale. I stedet bruker hver region sin egen dialekt, blant annet marokkansk, egyptisk, emiratarabisk, algerisk og levantinsk. Disse dialektene er i kontinuerlig utvikling, de er preget av utenlandske lånord og sjelden standardisert i skriftspråket. I tillegg kommer det såkalte «én-til-mange»-problemet: Den samme skrevne teksten kan uttales på flere ulike måter avhengig av talerens geografiske og sosiale bakgrunn. Bildet kompliseres ytterligere av «Arabizi», en hybridform der latinske bokstaver og tall blandes i uformell digital kommunikasjon, særlig blant unge på sosiale medier. Tilgangen på treningsdata av høy kvalitet er svært begrenset. «Selv opplæringsdata for generell arabisk er allerede mangelvare», erkjenner hovedforsker Chen Yushen. Han vurderer modellen til «fem av ti», selv om den overgår den amerikanske aktøren ElevenLabs med flere sentrale dialekter, inkludert De forente arabiske emirater, Marokko, Egypt og Algerie.

Les også: Den kunstige revolusjonen – den fjerde industrielle revolusjon 🔒

Å mestre arabisk

Et viktig konkurransefortrinn er at Habibi behersker «zero-shot»-teknologien, det vil si evnen til å klone en stemme basert på et kort lydopptak uten omfattende forhåndstrening. Det gir betydelige fordeler i sanntidsapplikasjoner som podkaster, TikTok-videoer, mikroserier og kundeservice. I MENA-regionen nærmer bruken av sosiale medier seg 100 prosent i De forente arabiske emirater, og brukerne tilbringer i gjennomsnitt mer enn tre timer daglig på sine foretrukne plattformer – godt over det globale snittet. Dette er et marked kinesiske teknologigiganter allerede har investert tungt i, fra TikTok til e-handel, og Habibi kan bidra til å ytterligere konsolidere denne posisjonen.

I et akademisk perspektiv omtaler en postdoktor ved Mohamed bin Zayed-universitetet for kunstig intelligens i Abu Dhabi, som har bedt om anonymitet, prosjektet som «ekstremt innovativt». Han understreker at modellens karakter med åpen kilde – i likhet med Alibabas Qwen-modellen – er en forutsetning for å vinne tillit i det internasjonale forskningsmiljøet, fordi de krever dyptgående og strukturell tilgang til de modellene de analyserer.

Ved å gjøre Habibi fritt tilgjengelig håper forskergruppen i Shanghai å samle forskere, morsmålsbrukere og utviklere fra hele verden. Målet er å øke datagrunnlaget, finjustere lokale talemåter og redusere uklarheter i overgangen mellom dialekter. «Vi er bare i begynnelsen», sier Chen – han har en klar ambisjon om å forankre Kinas teknologiske innflytelse i hjertet av den arabiske verden.

Når maskinene tar over: Kampen om menneskehetens fremtid

Notification

Du har nettopp lest en gratisartikkel

Geopolitika lever kun gjennom sine lesere. For å støtte oss, abonner eller doner.

John Mackenzie
John Mackenzie
Geopolitiker og krigskorrespondent, John Mackenzie reiser gjennom mange krigssoner.
Bell Icon

Du har nettopp lest en gratisartikkel

Geopolitika lever kun gjennom sine lesere. For å støtte oss abonnér eller donér!

Innholdsfortegnelse [hide]

Les mer

Siste nytt