Nous avons réuni une équipe diversifiée d'experts dans les domaines de l'IA et de la PNL. Leurs recherches inégalées et leurs percées primées continuent de fixer les normes du secteur, nous rapprochant de notre vision : créer un monde sans barrières linguistiques.
Des voix de premier plan dans le domaine
Notre équipe de recherche modifie la façon dont les humains communiquent
-
João Graça
Cofondateur et Directeur de la Technologie
-
André Martins
Vice-président de la recherche
-
Paulo Dimas
VP of Product Innovation
-
José Souza
Staff AI Research Scientist
-
M. Amin Farajian
AI Research Scientist senior
-
Fabio Kepler
AI Research Scientist senior
-
Ricardo Rei
AI Research Scientist senior
-
Catarina Farinha
AI Research Manager
-
João Alves
AI Research Scientist
-
Daan van Stigt
AI Research Scientist senior
-
Maria Ana Henriques
Responsable de projet R et D
-
Nuno André
Senior Grants Coordinator
-
Vera Cabarrão
Senior AI Quality Manager
-
Marina Sánchez Torrón
Analyste supérieur en language naturel
-
Marianna Buchicchio
Senior Manager AI Quality
-
Maximilian Kohl
Chef de produit senior
-
João Godinho
Ingénieur de recherche senior en IA
-
Pedro Mota
Ingénieur de recherche senior en IA
-
Nuno Guerreiro
AI Research Scientist
-
José Pombal
AI Research Scientist
-
Pedro Martins
AI Research Scientist senior
-
Muhammad Bilal
Senior Backend Engineering Manager
Projets
Center for Responsible AI
The Center for Responsible AI is one of the largest centers dedicated to Responsible AI, bringing together ten startups, eight research centers, a law firm, and five industry leaders, that will collaborate to develop 21 innovative AI products leveraged by Responsible AI technologies such as equity, explainability, and sustainability. The center is co-funded by the Portuguese PRR.
UTTER
UTTER – Unified Transcription and Translation for Extended Reality – is a collaborative Research and Innovation project funded under Horizon Europe that aims to leverage large language models to build the next generation of multimodal eXtended reality (XR) technologies for transcription, translation, summarisation, and minuting. UTTER’s use-case prototypes will cover (i) a personal assistant for meetings that can improve communication in the online world and (ii) an advanced customer service assistant to support global markets.
QUARTZ
QUARTZ ("traduction automatique de qualité ") est un projet de recherche de pointe financé par l'appel d'offres ouvert ELISE, qui vise à créer une TA responsable pour les données conversationnelles : une TA de haute qualité pour débloquer de nouveaux marchés où les erreurs critiques liées à la TA ne peuvent pas être tolérées.
MAIA
MAIA utilisera des technologies de pointe en matière d'apprentissage automatique et du traitement de langage naturel pour mettre au point des agents assistants multilingues IA, éliminant ainsi les barrières linguistiques. La "couche de traduction" de MAIA permettra aux agents humains de fournir une assistance à la clientèle en temps réel, dans n'importe quelle langue, avec une qualité humaine.
Marian, axée sur l'utilisateur
Improve the pre-existing neural machine translation toolkit “Marian” to address the needs of CEF eTranslation and to broaden its user base (H2020 Co-Funded Project). Terminology, on-the-fly domain adaptation, better documentation and GPU optimization are the focus areas in this Marian iteration.
MT4ALL
Aims at building data for under-resourced languages in fields of public interest, such as Health and Justice. It’ll contribute to the CEF Automated Translation Building block by enlarging its coverage for language pairs and domains for which parallel data does not exist (H2020 Co-Funded Project).
Unbabel4EU
We’re working on advancing European language engines for borderless business communication. Create Europe’s Translation Layer, specifically, by enabling seamless human-quality translation between any pairing of the 24 official languages of the EU in different content types such as Email, Chat and Listings (P2020 Co-Funded Project).
APE-QUEST
Setting up a quality gate and crowdsourcing workflow to improve translation quality in specific domains. Boost CEF eTranslation with Automated Post-Editing (APE) & Quality Estimation (QE) for Electronic Exchange of Social Security Information (EESSI) and Online Dispute Resolution (ODR) DSIs and related national services (H2020 Co-Funded Project).
INTERACT
Une communication rapide et précise est essentielle pour la gestion des crises, mais que se passe-t-il si la seule information disponible est dans une langue que vous ne comprenez pas ? Créé pour répondre à la nécessité d'une traduction de qualité dans les scénarios de crise sanitaire, INTERACT est un projet européen interdisciplinaire.
Unbabel Scribe
Transcription can be a big piece of translation flows, especially when it comes to audiovisual content. This project aims to research & develop a technical solution for automatic transcription and translation of audiovisual content by leveraging a community of human translators (P2020 Co-Funded Project).
DeepSPIN
L'apprentissage profond est en train de révolutionner le domaine du traitement du langage naturel (PNL), avec des percées dans la traduction automatique, la reconnaissance vocale et la réponse aux questions. Les nouvelles interfaces linguistiques (assistants numériques, applications de messagerie, robots de service à la clientèle) apparaissent comme les prochaines technologies permettant une communication multilingue transparente entre les humains et les machines.
Le plan d'internationalisation d'Unbabel
Unbabel’s Internationalization Plan (“Unbabel 2017-2019: Plano de Internacionalização”) is a project led by Unbabel and co-funded by Portugal 2020 – Sistema de Incentivos à Internacionalização das PME.
Unbabel 2017: A new ecosystem of Machine + Crowd Translation (Un nouvel écosystème de traduction automatique associée à une traduction par le public)
« Unbabel 2017: A new ecosystem of Machine + Crowd Translation » est un projet mené par Unbabel et cofinancé par le Portugal 2020 – Sistema de Incentivos à Investigação e Desenvolvimento Tecnológico (SI I&DT).
Projets et publications
MT-Telescope
MT-Telescope permet de comparer visuellement et avec précision la qualité de deux systèmes de traduction automatique (TA). Il lève le voile sur le score de qualité automatique, permettant aux utilisateurs de filtrer les performances de qualité par mots-clés, terminologie et longueur de segment. MT-Telescope est disponible en tant que source ouverte au profit de l'ensemble de la communauté MT R-D.
COMET
COMET (Crosslingual Optimized Metric for Evaluation of Translation) est un nouveau cadre neuronal pour la formation de modèles d'évaluation de traduction automatique (TA) multilingues. COMET prédit les jugements humains de la qualité de la TA. Ce modèle COMET "prêt à l'emploi" est disponible en tant que source ouverte au profit de l'ensemble de la communauté MT R-D.
MAIA
MAIA utilisera des technologies de pointe en matière d'apprentissage automatique et du traitement de langage naturel pour mettre au point des agents assistants multilingues IA, éliminant ainsi les barrières linguistiques. La "couche de traduction" de MAIA permettra aux agents humains de fournir une assistance à la clientèle en temps réel, dans n'importe quelle langue, avec une qualité humaine.
Marian, axée sur l'utilisateur
Improve the pre-existing neural machine translation toolkit “Marian” to address the needs of CEF eTranslation and to broaden its user base (H2020 Co-Funded Project). Terminology, on-the-fly domain adaptation, better documentation and GPU optimization are the focus areas in this Marian iteneration.
MT4ALL
Aims at building data for under-resourced languages in fields of public interest, such as Health and Justice. It’ll contribute to the CEF Automated Translation Building block by enlarging its coverage for language pairs and domains for which parallel data does not exist (H2020 Co-Funded Project).
Unbabel4EU
We’re working on advancing European language engines for borderless business communication. Create Europe’s Translation Layer, specifically, by enabling seamless human-quality translation between any pairing of the 24 official languages of the EU in different content types such as Email, Chat and Listings (P2020 Co-Funded Project).
OpenKiwi
Quality estimation (QE) is one of the challenges in MT: it evaluates a system’s quality without access to reference translations. We released OpenKiwi, a PyTorch-based open-source framework that implements the best QE systems from WMT 2015-18 shared tasks. The accompanying paper won the best system paper at ACL 2019.
APE-QUEST
Setting up a quality gate and crowdsourcing workflow to improve translation quality in specific domains. Boost CEF eTranslation with Automated Post-Editing (APE) & Quality Estimation (QE) for Electronic Exchange of Social Security Information (EESSI) and Online Dispute Resolution (ODR) DSIs and related national services (H2020 Co-Funded Project).
INTERACT
Une communication rapide et précise est essentielle pour la gestion des crises, mais que se passe-t-il si la seule information disponible est dans une langue que vous ne comprenez pas ? Créé pour répondre à la nécessité d'une traduction de qualité dans les scénarios de crise sanitaire, INTERACT est un projet européen interdisciplinaire.
Unbabel Scribe
Transcription can be a big piece of translation flows, especially when it comes to audiovisual content. This project aims to research & develop a technical solution for automatic transcription and translation of audiovisual content by leveraging a community of human translators (P2020 Co-Funded Project).
DeepSPIN
L'apprentissage profond est en train de révolutionner le domaine du traitement du langage naturel (PNL), avec des percées dans la traduction automatique, la reconnaissance vocale et la réponse aux questions. Les nouvelles interfaces linguistiques (assistants numériques, applications de messagerie, robots de service à la clientèle) apparaissent comme les prochaines technologies permettant une communication multilingue transparente entre les humains et les machines.
Outils libres
XCOMET
XCOMET is a cutting-edge, open-source metric designed to be more interpretable and better aligned with MQM human evaluations. XCOMET combines sentence-level evaluation, similar to neural metrics such as COMET and BLEURT, and error span detection capabilities.
TowerLLM
TowerLLM is a suite of multilingual large language models (LLM) optimized for translation-related tasks ranging from pre-translation, to translation and evaluation tasks, such as machine translation (MT), automatic post-editing (APE), and translation ranking. Tower is built on top of LLaMA2 [1], comes in two sizes — 7B and 13B parameters —, and currently supports 10 languages.
CometKiwi XL
CometKiwiXL is large language model (LLM) specialized in predicting the quality of a translation. CometKiwi XL (3.5B) and CometKiwi XXL (10.7B) are the open-sourced versions of our state-of-the-art Quality Estimation model.
MT-Telescope
MT-Telescope permet de comparer visuellement et avec précision la qualité de deux systèmes de traduction automatique (TA). Il lève le voile sur le score de qualité automatique, permettant aux utilisateurs de filtrer les performances de qualité par mots-clés, terminologie et longueur de segment. MT-Telescope est disponible en tant que source ouverte au profit de l'ensemble de la communauté MT R-D.
COMET
COMET (Crosslingual Optimized Metric for Evaluation of Translation) est un nouveau cadre neuronal pour la formation de modèles d'évaluation de traduction automatique (TA) multilingues. COMET prédit les jugements humains de la qualité de la TA. Ce modèle COMET "prêt à l'emploi" est disponible en tant que source ouverte au profit de l'ensemble de la communauté MT R-D.
OpenKiwi
Quality estimation (QE) is one of the challenges in MT: it evaluates a system’s quality without access to reference translations. We released OpenKiwi, a PyTorch-based open-source framework that implements the best QE systems from WMT 2015-18 shared tasks. The accompanying paper won the best system paper at ACL 2019.
Récompenses
Eighth Conference on Machine Translation
Winners of the WMT 2023 QE Shared Task
Eighth Conference on Machine Translation
Winners of the WMT 2023 Metrics Shared Task
COMET22
Winning submission for the Chinese-English language pair and the second best for the other two language pairs in the WMT2022 Metrics shared task
CometKiwi
Winning submission of the WMT 2022 Quality Estimation (QE) shared task
Best Presentation award for the Users and Providers track
AMTA Conference 2022
Best Paper Award
EAMT Conference 2022 ( Title: Searching for Cometinho: The Little Metric That Could)
L'entreprise la plus innovante
Entreprise la plus innovante (au concours Game Changer Innovation), TAUS (Translation Automation User Society)
2015, 2017Meilleur système international de Quality Estimation des traductions automatiques
WMT - Conférence sur la traduction automatique,
2016, 2019Meilleur système de post-édition automatique pour la traduction automatique globale
WMT - Conférence sur la traduction automatique,
2019Prix de la meilleure démonstration de système
Association for Computational Linguistics (Association pour la linguistique informatique),
2019Mélanger l'intelligence humaine et l'intelligence artificielle
Mélanger l'intelligence humaine et l'intelligence artificielle, en partenariat avec Concentrix, Royaume-Uni, National Innovation Awards,
2019Meilleure innovation en matière de service à la clientèle
Meilleure innovation en matière de service à la clientèle, en partenariat avec Concentrix, ECCCSA - European Contact Center and Customer Service Awards,
2019Meilleure utilisation de l'IA et des technologies associées
Meilleure utilisation de l'IA et des technologies associées, en partenariat avec Microsoft, ECCCSA – European Contact Center et Customer Service Awards,
2019Les startups les plus innovantes dans le domaine de l'intelligence artificielle Disruptive Technology
Liste des startups les plus innovantes dans le domaine de l'intelligence artificielle pour la technologie de rupture de l'année, CBInsights,
2019Les entreprises les plus innovantes
Liste annuelle de Fast Company des entreprises les plus innovantes du monde pour 2020, Fast Company,
2020Produit de l'année primé
Les lauréats du prix du produit de l'année, décerné par le magazine CUSTOMER,
2021Prix de la meilleure approche en matière d'explicabilité
Atelier sur l'évaluation et la comparaison des systèmes PNL, co-localisé avec EMNLP,
2021