- Global Voices in het Nederlands - https://nl.globalvoices.org -

AI gebruiken om taal te ‘dekoloniseren’

Categorieën: Kenia, Uganda, Burgermedia, Digitaal activisme, Internationale betrekkingen, Ontwikkeling, Technologie, The Bridge, GV Advocacy

Illustratie door Both Nomads/DALL· E 2, gebruikt met toestemming.

We moeten een nieuwe taal vinden, een nieuw narratief, een nieuw wereldbeeld en de tools om de woorden te creëren waarmee we het ‘grote humanitaire verhaal’ verwerken. Kan technologie helpen?

Velen van ons hebben de afgelopen maand gehoord over de “Matrix”-achtige functies van de nieuwe AI-aangedreven ChatGPT, die burgers verontrust, en emoties oproept, variërend van angst tot enthousiasme.

Het gebruik van AI blijft niche voor de meeste maatschappelijke organisaties en activisten. Toch verschijnen er verschillende initiatieven die opkomende technologieën en kunstmatige intelligentie gebruiken om taal te “dekoloniseren” – vooral in de ontwikkelingssector.

Is ontwikkelingstaal koloniaal?

De vraag of ontwikkelingstaal koloniaal is, is een complex en veel besproken onderwerp. Het opleggen van Europese talen en culturen aan gekoloniseerde volkeren is een belangrijk onderdeel geweest van het proces van kolonialisme. Koloniale machten legden hun talen op, wat vaak leidde tot de erosie van inheemse talen. Ontwikkelingstaal kan worden gezien als een voortzetting van deze erfenis, omdat ze vaak inheemse en minderheidstalen uitsluit, waardoor patronen van taalkundige en culturele dominantie versterkt worden.

“Taal is een cruciaal onderdeel van de identiteit en het erfgoed van een gemeenschap. Als we talen verliezen, gaat een deel van onze collectieve geschiedenis en cultuur verloren. Technologie kan ons helpen deze talen te behouden en te promoten, maar we moeten dit doen op een manier die respectvol en inclusief is,” zegt Anju Mary Paul, onderzoeksleider bij FirstVoices [1] , een platform met een AI-aangedreven taalarchief, waarmee gebruikers audio- en video-opnames van inheemse talen kunnen zoeken en openen.

“Het feit dat we Frans of Engels als ontwikkelingstalen gebruiken, terwijl we in bepaalde gemeenschappen zoals in Afrika verschillende tribale talen hebben, is een probleem. Wat gebeurt er als mensen de taal die we gebruiken niet begrijpen?”, vraagt Dr. Moses Isooba, uitvoerend directeur van het Uganda National NGO Forum [2] (UNNGOF).

Lexicon en taalprototype

Isooba maakt deel uit van een team dat een taal- en lexiconprototype ontwikkelt [3] met behulp van AI om meer inclusieve communicatie mogelijk te maken die minder (of niet) impliciet neokoloniaal, seksistisch of racistisch is. Het idee is om de toepassing van AI te onderzoeken om het lexicon van pejoratief jargon, idiomen en terminologie, “opgelegd” aan maatschappelijke organisaties die betrokken zijn bij het netwerk van internationale hulp en de ontwikkelingssector, te corrigeren en te vervangen.

Het team ontwerpt een lexicon om de macht op twee manieren te verschuiven: ten eerste door problematische taal af te schaffen, terwijl meer inclusieve communicatie wordt aangemoedigd met behulp van een nieuwe zoek-en-vervang-stijlfunctie, en ten tweede door mensen in staat te stellen hun eigen lokale taal te gebruiken door hun werk te testen met Luganda, de taal die vaak wordt gebruikt in Oeganda.

Termen als ‘desk officer’ of ‘in het veld’ doen denken aan het koloniale tijdperk. Internationale humanitaire organisaties verwijzen vaak naar hun kantoren in het Globale Zuiden als “landenkantoor”, vergelijkbaar met koloniale buitenposten “die fungeren als het resterende touw dat ons aan het koloniale schip bindt”, zegt Dr. Isooba. Hij verklaart nader:

Decolonising language is critically important because language sets the terms of engagement between the north and south. In as much as possible language should be depoliticized and decolonized. Development and humanitarian assistance are political, but our language should remain nonpartisan. Political parties will come and go, but inequalities will remain if our language begins to mirror that of the people in power, especially if the intentions behind the rhetoric are disingenuous.”

“Het dekoloniseren van taal is van cruciaal belang omdat taal de voorwaarden bepaalt voor betrokkenheid tussen het noorden en het zuiden. Taal moet zo veel mogelijk worden gedepolitiseerd en gedekoloniseerd. Ontwikkeling en humanitaire hulp zijn politiek, maar onze taal moet partijloos blijven. Politieke partijen zullen komen en gaan, maar ongelijkheden zullen blijven bestaan als onze taal die van de machthebbers begint te weerspiegelen, vooral als de intenties achter de retoriek onoprecht zijn. “

Illustratie door Both Nomads/DALL· E 2, gebruikt met toestemming.

We kunnen niet enkel in acroniemen spreken

“Ontwikkelingstaal bevat inmiddels zo veel jargon dat zelfs onze eigen families niet meer begrijpen waar we mee bezig zijn”, legt Harsh Jaitli van het Voluntary Action Network India [4] (VANI) uit.

Taal is een van onze meest voorouderlijke hulpmiddelen ten goede en ten kwade. In een online universum dat geplaagd wordt door desinformatie en aanvallen, richten verschillende activisten en maatschappelijke organisaties zich nu op “nieuwe verhalen” om de maatschappelijke ruimte uit te breiden in plaats van te verkleinen.

In de afgelopen jaren hebben veel initiatieven en organisaties gewerkt op het snijvlak van AI en taal. Masakhane [5] is bijvoorbeeld een grassroots, door de gemeenschap gedreven initiatief dat werkt aan het bouwen van Natural Language Processing tools (NLP) en modellen voor Afrikaanse talen, met als doel ze te behouden en te promoten in het digitale tijdperk. Tolken en vertalen maken ook deel uit van het spel, en organisaties werken nu aan het verbreden van het spectrum, bijvoorbeeld met deze gratis Chichewa-Engelse vertaalwoordenlijst met ontwikkelingsterminologie. AI for the People [6] richt zich op het streven naar meer inclusieve en rechtvaardige ontwikkeling en inzet van AI-technologieën. Het biedt ook middelen en training voor gemeenschappen om met AI te werken.

Maar volgens NeuralSpace, een platform dat helpt om de enorme taalkloof in technologie te overbruggen, is 90 procent van de NLP-oplossingen exclusief beschikbaar in Europese talen. AI heeft het potentieel om taalbarrières voor de resterende zes miljard mensen te doorbreken door deze vorm van ‘digitale apartheid’ tegen te gaan. Hoe? Door taalbarrières te overbruggen met complexe vertaalsystemen of apps voor het leren van talen, bijvoorbeeld. Andere manieren zijn het creëren van digitale archieven met optische tekenherkenning of spraakherkenning en het beschikbaar maken van inhoud in de moedertalen in plaats van de alomtegenwoordige “koloniale” talen.

Maar dit klinkt allemaal te mooi om (gewoon) waar te zijn. Voordat AI taal kan dekoloniseren, moet AI zelf gedekoloniseerd worden.

De AI paradox

AI heeft het potentieel om de manier waarop we communiceren te transformeren, maar het is ook het perfecte medium om bestaande vooroordelen te verergeren. “We moeten problemen van vooringenomenheid in taalmodellen aanpakken en ervoor zorgen dat ze inclusief en representatief zijn voor alle gebruikers”, zegt Soujanya Poria [7], assistent-professor aan de Nanyang Technological University.

De taal waarop AI is getraind, is misschien al “vervormd” en niet in staat om bevooroordeeld menselijk denken en gedrag te vervangen.

“De dekolonisatie van taal is van cruciaal belang voor de emancipatie van gemeenschappen en het in vraag stellen van dominante verhalen. Technologie heeft het potentieel om een krachtig hulpmiddel te zijn in dit proces, maar we moeten oppassen dat we niet dezelfde patronen van uitsluiting en marginalisatie repliceren die we proberen te overwinnen,” zegt Dr. Isooba.

We vroegen ChatGPT of AI koloniale, racistische of seksistische taal kon repliceren en dit is het antwoord:

As an artificial intelligence language model, I am not capable of holding or expressing personal beliefs, values, or biases. However, I acknowledge that the data used to train me may contain biases and I strive to provide information that is accurate, unbiased, and inclusive. It is important to note that it is people who program and use AI, and they can unintentionally embed their own biases in the development and use of AI systems. Therefore, it is crucial to be aware of these potential biases and strive to create and use AI systems in an ethical, inclusive, and responsible manner.

“Als taalmodel voor kunstmatige intelligentie ben ik niet in staat om persoonlijke overtuigingen, waarden of vooroordelen te hebben of uit te drukken. Ik erken echter dat de gegevens die worden gebruikt om mij te trainen vooroordelen kunnen bevatten en ik streef ernaar om informatie te verstrekken die nauwkeurig, onbevooroordeeld en inclusief is. Het is belangrijk op te merken dat het mensen zijn die AI programmeren en gebruiken, en ze kunnen onbedoeld hun eigen vooroordelen inbedden in de ontwikkeling en het gebruik van AI-systemen. Daarom is het cruciaal om je bewust te zijn van deze potentiële vooroordelen en ernaar te streven om AI-systemen op een ethische, inclusieve en verantwoorde manier te creëren en te gebruiken.”

In de woorden van Timnit Gebru, van Black in AI, [8] we moeten afstappen van het denken over “schone” en “vuile” gegevens en overgaan naar het denken over gegevens die de diversiteit van de echte wereld weerspiegelen.

“Een van de beste manieren om dit te doen, is door diverse teams van datawetenschappers samen te stellen die in staat zijn om hun eigen vooroordelen te herkennen en aan te pakken,” zegt hij.

Sabelo Mhlambi en andere deskundigen hebben onlangs de Decolonial AI Manyfesto [9] opgesteld om “voorbij westerse vooroordelen te gaan” en “waardige sociaal-technische toekomsten” op te bouwen. Het maatschappelijk middenveld is ook steeds meer betrokken bij de ontwikkeling van AI door actief deel te nemen aan openbare discussies en debatten over de ethische, sociale en politieke implicaties van AI-technologieën. Toch zijn er verschillende leiders en activisten van het maatschappelijk middenveld zoals Mwarimū Mūtemi wa Kīama [10] uit Kenia, gearresteerd voor zijn tweets [11], die stellen dat de doelbewuste uitsluiting van gemarginaliseerde stemmen van technische besluitvormingsprocessen een vorm van structureel geweld is.

“We moeten erkennen dat toegang tot technologie een mensenrecht is en ervoor zorgen dat iedereen een plaats aan de tafel krijgt”, zegt Kīama.

Dianne Olivan, een digitale rechten- en genderactiviste, vertelt ons hoe de gemarginaliseerden worden “uitgesloten” van besluitvormingsomgevingen omdat deze functioneren binnen een neokoloniaal kader:

Those who usually participate in these conversations also have the privilege to participate; they have the economic and cultural capital to contribute and thrive. There are of course attempts to be representative and inclusive, but we should ask: Where are these conversations happening? What do I need to have to participate? In what language are they sharing meaning? Whose voices are the loudest in the room? What happens after these conversations, what is the accountability framework?

“Degenen die gewoonlijk deelnemen aan deze gesprekken hebben ook het voorrecht om deel te nemen; ze hebben het economische en culturele kapitaal om bij te dragen en te gedijen. Er zijn natuurlijk pogingen om representatief en inclusief te zijn, maar we moeten ons afvragen: waar vinden deze gesprekken plaats? Wat heb ik nodig om deel te nemen? In welke taal wordt betekenis gedeeld? Wiens stemmen klinken het luidst in de kamer? Wat gebeurt er na deze gesprekken, wat is het verantwoordingskader?”

Na deze “consultatieve” bijeenkomsten in de beleidsvorming voor digitale rechten en internetgovernance, keren we allemaal terug naar dezelfde digitale machtsstructuren, die de informatie die we opzoeken en bewaren, toestaan en verbieden, en die bepalen welke identiteiten op deze platforms mogen bestaan, zegt Olivan:

Truly inclusive digital communities and infrastructure require transformative lens from their inception – they reject a capitalist internet. They are driven by creativity, sharing, care, consent, and well-being; they challenge and circumvent infrastructures of surveillance. And we will build that by first, shifting our focus from working towards being accepted by the loudest, most articulate voices in a stingy meeting room, to holding space and looking for those who are not even able to go through the door.

“Echt inclusieve digitale gemeenschappen en infrastructuur vereisen een transformatieve lens vanaf het begin – ze wijzen een kapitalistisch internet af. Ze worden gedreven door creativiteit, delen, zorg, toestemming en welzijn; zij dagen de infrastructuur van toezicht uit en omzeilen ze. En we zullen dat opbouwen door eerst onze focus te leggen op het werken aan acceptatie door de luidste, meest uitgesproken stemmen in een bekrompen  vergadering, en dan te zoeken naar en plaats te houden voor diegenen die niet eens door de deur geraken.”