We hebben een divers team van deskundigen op het gebied van AI en NLP samengesteld. Hun ongeëvenaarde onderzoek en bekroonde doorbraken blijven de industriestandaarden bepalen en brengen ons dichter bij onze visie: het creëren van een wereld zonder taalbarrières.
Toonaangevende stemmen in het veld
Ons onderzoeksteam verandert de manier waarop mensen communiceren
-
João Graça
Medeoprichter en Chief Technology Officer
-
André Martins
VP of Research
-
Paulo Dimas
VP of Product Innovation
-
José Souza
Staff AI Research Scientist
-
M. Amin Farajian
Senior AI Research Scientist
-
Fabio Kepler
Senior AI Research Scientist
-
Ricardo Rei
Senior AI Research Scientist
-
Catarina Farinha
AI Research Manager
-
João Alves
AI Research Scientist
-
Daan van Stigt
Senior AI Research Scientist
-
Maria Ana Henriques
R&D Projectmanager
-
Nuno André
Senior Grants Coordinator
-
Vera Cabarrão
Senior AI Quality Manager
-
Marianna Buchicchio
Senior Manager AI Quality
-
João Godinho
Senior AI Research Engineer
-
Pedro Mota
Senior AI Research Engineer
-
Nuno Guerreiro
AI Research Scientist
-
José Pombal
AI Research Scientist
-
Pedro Martins
Senior AI Research Scientist
-
Muhammad Bilal
Senior Backend Engineering Manager
-
Ana Oliveira António
Junior Communications and Project Manager
-
António Novais
Junior Grants Coordinator
Projecten
Center for Responsible AI
The Center for Responsible AI is one of the largest centers dedicated to Responsible AI, bringing together ten startups, eight research centers, a law firm, and five industry leaders, that will collaborate to develop 21 innovative AI products leveraged by Responsible AI technologies such as equity, explainability, and sustainability. The center is co-funded by the Portuguese PRR.
UTTER
UTTER – Unified Transcription and Translation for Extended Reality – is a collaborative Research and Innovation project funded under Horizon Europe that aims to leverage large language models to build the next generation of multimodal eXtended reality (XR) technologies for transcription, translation, summarisation, and minuting. UTTER’s use-case prototypes will cover (i) a personal assistant for meetings that can improve communication in the online world and (ii) an advanced customer service assistant to support global markets.
QUARTZ
QUARTZ (kwaliteitsbewuste automatische vertaling) is een baanbrekend onderzoeksproject gefinancierd door de ELISE Open Call om Responsible MT te bouwen voor conversatiegegevens: MT van hoge kwaliteit om nieuwe markten te ontsluiten waar kritische MT-fouten niet getolereerd kunnen worden.
MAIA
MAIA maakt gebruik van geavanceerde technologieën voor machinaal leren en natuurlijke taalverwerking om meertalige AI-agentassistenten te bouwen en taalbarrières te elimineren. MAIA's 'vertaallaag' zal menselijke agenten in staat stellen klantondersteuning te bieden in realtime en in elke taal, met menselijke kwaliteit.
Gebruikersgericht Marian
Improve the pre-existing neural machine translation toolkit “Marian” to address the needs of CEF eTranslation and to broaden its user base (H2020 Co-Funded Project). Terminology, on-the-fly domain adaptation, better documentation and GPU optimization are the focus areas in this Marian iteration.
MT4ALL
Aims at building data for under-resourced languages in fields of public interest, such as Health and Justice. It’ll contribute to the CEF Automated Translation Building block by enlarging its coverage for language pairs and domains for which parallel data does not exist (H2020 Co-Funded Project).
Unbabel4EU
We’re working on advancing European language engines for borderless business communication. Create Europe’s Translation Layer, specifically, by enabling seamless human-quality translation between any pairing of the 24 official languages of the EU in different content types such as Email, Chat and Listings (P2020 Co-Funded Project).
APE-QUEST
Setting up a quality gate and crowdsourcing workflow to improve translation quality in specific domains. Boost CEF eTranslation with Automated Post-Editing (APE) & Quality Estimation (QE) for Electronic Exchange of Social Security Information (EESSI) and Online Dispute Resolution (ODR) DSIs and related national services (H2020 Co-Funded Project).
INTERACT
Tijdige en accurate communicatie is essentieel voor crisisbeheer, maar wat als de enige beschikbare informatie in een taal is die u niet spreekt? INTERACT is een interdisciplinair Europees project dat is opgezet om tegemoet te komen aan de behoefte aan kwaliteitsvertaling in gezondheidscrisisscenario's.
Unbabel Scribe
Transcription can be a big piece of translation flows, especially when it comes to audiovisual content. This project aims to research & develop a technical solution for automatic transcription and translation of audiovisual content by leveraging a community of human translators (P2020 Co-Funded Project).
DeepSPIN
Deep learning zorgt voor een revolutie op het gebied van Natural Language Processing (NLP), met doorbraken in automatische vertaling, spraakherkenning en het beantwoorden van vragen. Nieuwe taalinterfaces (digitale assistenten, messenger apps, customer service bots) zijn in opkomst als de volgende technologieën voor naadloze, meertalige communicatie tussen mensen en machines.
Unbabel’s Internationalization Plan
Unbabel’s Internationalization Plan (“Unbabel 2017-2019: Plano de Internacionalização”) is a project led by Unbabel and co-funded by Portugal 2020 – Sistema de Incentivos à Internacionalização das PME.
Unbabel 2017: A new ecosystem of Machine + Crowd Translation
“Unbabel 2017: A new ecosystem of Machine + Crowd Translation” is a project led by Unbabel and co-funded by Portugal 2020 – Sistema de Incentivos à Investigação e Desenvolvimento Tecnológico (SI I&DT)
Projecten & publicaties
MT-Telescope
MT-Telescope biedt een fijnmazige, visuele vergelijking van de kwaliteitsprestaties van twee automatische vertaling (MT)-systemen. De automatische kwaliteitsscore wordt verbeterd, zodat gebruikers de kwaliteitsprestaties kunnen filteren op trefwoorden, terminologie en segmentlengte. MT-Telescope is beschikbaar als open-source ten behoeve van de bredere MT R&D-gemeenschap.
COMET
COMET (Crosslingual Optimized Metric for Evaluation of Translation) is een nieuw neuraal kader voor het trainen van evaluatiemodellen voor meertalige automatische vertaling (MT). COMET voorspelt menselijke beoordelingen van MT-kwaliteit. Dit 'gebruiksklare' getrainde COMET-model is als open-source beschikbaar ten behoeve van de bredere MT R&D-gemeenschap.
MAIA
MAIA maakt gebruik van geavanceerde technologieën voor machinaal leren en natuurlijke taalverwerking om meertalige AI-agentassistenten te bouwen en taalbarrières te elimineren. MAIA's 'vertaallaag' zal menselijke agenten in staat stellen klantondersteuning te bieden in realtime en in elke taal, met menselijke kwaliteit.
Gebruikersgericht Marian
Improve the pre-existing neural machine translation toolkit “Marian” to address the needs of CEF eTranslation and to broaden its user base (H2020 Co-Funded Project). Terminology, on-the-fly domain adaptation, better documentation and GPU optimization are the focus areas in this Marian iteneration.
MT4ALL
Aims at building data for under-resourced languages in fields of public interest, such as Health and Justice. It’ll contribute to the CEF Automated Translation Building block by enlarging its coverage for language pairs and domains for which parallel data does not exist (H2020 Co-Funded Project).
Unbabel4EU
We’re working on advancing European language engines for borderless business communication. Create Europe’s Translation Layer, specifically, by enabling seamless human-quality translation between any pairing of the 24 official languages of the EU in different content types such as Email, Chat and Listings (P2020 Co-Funded Project).
OpenKiwi
Quality estimation (QE) is one of the challenges in MT: it evaluates a system’s quality without access to reference translations. We released OpenKiwi, a PyTorch-based open-source framework that implements the best QE systems from WMT 2015-18 shared tasks. The accompanying paper won the best system paper at ACL 2019.
APE-QUEST
Setting up a quality gate and crowdsourcing workflow to improve translation quality in specific domains. Boost CEF eTranslation with Automated Post-Editing (APE) & Quality Estimation (QE) for Electronic Exchange of Social Security Information (EESSI) and Online Dispute Resolution (ODR) DSIs and related national services (H2020 Co-Funded Project).
INTERACT
Tijdige en accurate communicatie is essentieel voor crisisbeheer, maar wat als de enige beschikbare informatie in een taal is die u niet spreekt? INTERACT is een interdisciplinair Europees project dat is opgezet om tegemoet te komen aan de behoefte aan kwaliteitsvertaling in gezondheidscrisisscenario's.
Unbabel Scribe
Transcription can be a big piece of translation flows, especially when it comes to audiovisual content. This project aims to research & develop a technical solution for automatic transcription and translation of audiovisual content by leveraging a community of human translators (P2020 Co-Funded Project).
DeepSPIN
Deep learning zorgt voor een revolutie op het gebied van Natural Language Processing (NLP), met doorbraken in automatische vertaling, spraakherkenning en het beantwoorden van vragen. Nieuwe taalinterfaces (digitale assistenten, messenger apps, customer service bots) zijn in opkomst als de volgende technologieën voor naadloze, meertalige communicatie tussen mensen en machines.
Open-source hulpmiddelen
XCOMET
XCOMET is a cutting-edge, open-source metric designed to be more interpretable and better aligned with MQM human evaluations. XCOMET combines sentence-level evaluation, similar to neural metrics such as COMET and BLEURT, and error span detection capabilities.
TowerLLM
TowerLLM is a suite of multilingual large language models (LLM) optimized for translation-related tasks ranging from pre-translation, to translation and evaluation tasks, such as machine translation (MT), automatic post-editing (APE), and translation ranking. Tower is built on top of LLaMA2 [1], comes in two sizes — 7B and 13B parameters —, and currently supports 10 languages.
CometKiwi XL
CometKiwiXL is large language model (LLM) specialized in predicting the quality of a translation. CometKiwi XL (3.5B) and CometKiwi XXL (10.7B) are the open-sourced versions of our state-of-the-art Quality Estimation model.
MT-Telescope
MT-Telescope biedt een fijnmazige, visuele vergelijking van de kwaliteitsprestaties van twee automatische vertaling (MT)-systemen. De automatische kwaliteitsscore wordt verbeterd, zodat gebruikers de kwaliteitsprestaties kunnen filteren op trefwoorden, terminologie en segmentlengte. MT-Telescope is beschikbaar als open-source ten behoeve van de bredere MT R&D-gemeenschap.
COMET
COMET (Crosslingual Optimized Metric for Evaluation of Translation) is een nieuw neuraal kader voor het trainen van evaluatiemodellen voor meertalige automatische vertaling (MT). COMET voorspelt menselijke beoordelingen van MT-kwaliteit. Dit 'gebruiksklare' getrainde COMET-model is als open-source beschikbaar ten behoeve van de bredere MT R&D-gemeenschap.
OpenKiwi
Quality estimation (QE) is one of the challenges in MT: it evaluates a system’s quality without access to reference translations. We released OpenKiwi, a PyTorch-based open-source framework that implements the best QE systems from WMT 2015-18 shared tasks. The accompanying paper won the best system paper at ACL 2019.
Onderscheidingen
Eighth Conference on Machine Translation
Winners of the WMT 2023 QE Shared Task
Eighth Conference on Machine Translation
Winners of the WMT 2023 Metrics Shared Task
COMET22
Winning submission for the Chinese-English language pair and the second best for the other two language pairs in the WMT2022 Metrics shared task
CometKiwi
Winning submission of the WMT 2022 Quality Estimation (QE) shared task
Best Presentation award for the Users and Providers track
AMTA Conference 2022
Best Paper Award
EAMT Conference 2022 ( Title: Searching for Cometinho: The Little Metric That Could)
Meest innovatieve bedrijf
Meest innovatieve bedrijf (bij de Game Changer Innovation Contest), TAUS (Translation Automation User Society)
2015, 2017Beste wereldwijde systeem voor Quality Estimation voor automatische vertaling
WMT - Conferentie over automatische vertaling,
2016, 2019Beste automatische vertaling en nabewerkingssysteem ter wereld
WMT - Conferentie over automatische vertaling,
2019Prijs voor de beste systeemdemonstratie
Association for Computational Linguistics,
2019Mengen van menselijke & kunstmatige intelligentie
Blending Human & Artificial Intelligence, in samenwerking met Concentrix, UK, National Innovation Awards,
2019Beste innovatie op het gebied van klantenservice
Beste innovatie in klantenservice, in samenwerking met Concentrix, ECCCSA - European Contact Center and Customer Service Awards,
2019Optimaal gebruik van AI en aanverwante technologieën
Beste gebruik van AI en aanverwante technologieën, in samenwerking met Microsoft, ECCCSA – European Contact Center en Customer Service Awards,
2019Meest innovatieve AI-start-ups voor disruptieve technologie
Lijst van meest innovatieve AI-start-ups voor disruptieve technologie van het jaar, CBInsights,
2019Meest innovatieve bedrijven
Fast Company's jaarlijkse lijst met de meest innovatieve bedrijven ter wereld voor 2020, Fast Company,
2020Winnaar Product van het Jaar
Winnaars van de Product of the Year Award, uitgereikt door het tijdschrift CUSTOMER,
2021Best Explainability Approach Award
Workshop over evaluatie & vergelijking van NLP-systemen, medegevestigd bij EMNLP,
2021