Technologie inégalée + recherche inégalée

Nous avons réuni une équipe diversifiée d'experts dans les domaines de l'IA et de la PNL. Leurs recherches inégalées et leurs percées primées continuent de fixer les normes du secteur, nous rapprochant de notre vision : créer un monde sans barrières linguistiques.

Des voix de premier plan dans le domaine

Notre équipe de recherche modifie la façon dont les humains communiquent

  • João Graça, Co-Founder and Chief Technology Officer at Unbabel

    João Graça

    Cofondateur et Directeur de la Technologie

  • André Martins

    Vice-président de la recherche

  • Paulo Dimas

    VP of Product Innovation

  • José Souza

    Staff AI Research Scientist

  • M. Amin Farajian

    AI Research Scientist senior

  • Fabio Kepler

    AI Research Scientist senior

  • Ricardo Rei

    Ricardo Rei

    AI Research Scientist senior

  • Catarina Farinha

    AI Research Manager

  • João Alves

    AI Research Scientist

  • Daan van Stigt

    Daan van Stigt

    AI Research Scientist senior

  • Maria Ana Henriques

    Maria Ana Henriques

    Responsable de projet R et D

  • Nuno André

    Nuno André

    Senior Grants Coordinator

  • Vera Cabarrão

    Vera Cabarrão

    Senior AI Quality Manager

  • Marianna Buchicchio

    Senior Manager AI Quality

  • João Godinho

    Ingénieur de recherche senior en IA

  • Pedro Mota

    Ingénieur de recherche senior en IA

  • Nuno Guerreiro

    Nuno Guerreiro

    AI Research Scientist

  • José Pombal

    AI Research Scientist

  • Pedro Martins

    AI Research Scientist senior

  • Muhammad Bilal

    Muhammad Bilal

    Senior Backend Engineering Manager

  • Ana Oliveira António, Junior Communications and Project Manager @ Unbabel

    Ana Oliveira António

    Junior Communications and Project Manager

  • António Novais

    Junior Grants Coordinator

Projets

  • Center for Responsible AI

    The Center for Responsible AI is one of the largest centers dedicated to Responsible AI, bringing together ten startups, eight research centers, a law firm, and five industry leaders, that will collaborate to develop 21 innovative AI products leveraged by Responsible AI technologies such as equity, explainability, and sustainability. The center is co-funded by the Portuguese PRR.

  • UTTER

    UTTER – Unified Transcription and Translation for Extended Reality – is a collaborative Research and Innovation project funded under Horizon Europe that aims to leverage large language models to build the next generation of multimodal eXtended reality (XR) technologies for transcription, translation, summarisation, and minuting. UTTER’s use-case prototypes will cover (i) a personal assistant for meetings that can improve communication in the online world and (ii) an advanced customer service assistant to support global markets.

  • QUARTZ

    QUARTZ ("traduction automatique de qualité ") est un projet de recherche de pointe financé par l'appel d'offres ouvert ELISE, qui vise à créer une TA responsable pour les données conversationnelles : une TA de haute qualité pour débloquer de nouveaux marchés où les erreurs critiques liées à la TA ne peuvent pas être tolérées.

  • MAIA

    MAIA utilisera des technologies de pointe en matière d'apprentissage automatique et du traitement de langage naturel pour mettre au point des agents assistants multilingues IA, éliminant ainsi les barrières linguistiques. La "couche de traduction" de MAIA permettra aux agents humains de fournir une assistance à la clientèle en temps réel, dans n'importe quelle langue, avec une qualité humaine.

  • Marian, axée sur l'utilisateur

    Improve the pre-existing neural machine translation toolkit “Marian” to address the needs of CEF eTranslation and to broaden its user base (H2020 Co-Funded Project). Terminology, on-the-fly domain adaptation, better documentation and GPU optimization are the focus areas in this Marian iteration.

  • MT4ALL

    Aims at building data for under-resourced languages in fields of public interest, such as Health and Justice. It’ll contribute to the CEF Automated Translation Building block by enlarging its coverage for language pairs and domains for which parallel data does not exist (H2020 Co-Funded Project).

  • Unbabel4EU

    We’re working on advancing European language engines for borderless business communication. Create Europe’s Translation Layer, specifically, by enabling seamless human-quality translation between any pairing of the 24 official languages of the EU in different content types such as Email, Chat and Listings (P2020 Co-Funded Project).

  • APE-QUEST

    Setting up a quality gate and crowdsourcing workflow to improve translation quality in specific domains. Boost CEF eTranslation with Automated Post-Editing (APE) & Quality Estimation (QE) for Electronic Exchange of Social Security Information (EESSI) and Online Dispute Resolution (ODR) DSIs and related national services (H2020 Co-Funded Project).

  • INTERACT

    Une communication rapide et précise est essentielle pour la gestion des crises, mais que se passe-t-il si la seule information disponible est dans une langue que vous ne comprenez pas ? Créé pour répondre à la nécessité d'une traduction de qualité dans les scénarios de crise sanitaire, INTERACT est un projet européen interdisciplinaire.

  • Unbabel Scribe

    Transcription can be a big piece of translation flows, especially when it comes to audiovisual content. This project aims to research & develop a technical solution for automatic transcription and translation of audiovisual content by leveraging a community of human translators (P2020 Co-Funded Project).

  • DeepSPIN

    L'apprentissage profond est en train de révolutionner le domaine du traitement du langage naturel (PNL), avec des percées dans la traduction automatique, la reconnaissance vocale et la réponse aux questions. Les nouvelles interfaces linguistiques (assistants numériques, applications de messagerie, robots de service à la clientèle) apparaissent comme les prochaines technologies permettant une communication multilingue transparente entre les humains et les machines.

  • Le plan d'internationalisation d'Unbabel

    Unbabel’s Internationalization Plan (“Unbabel 2017-2019: Plano de Internacionalização”) is a project led by Unbabel and co-funded by Portugal 2020 – Sistema de Incentivos à Internacionalização das PME.

  • Unbabel 2017: A new ecosystem of Machine + Crowd Translation (Un nouvel écosystème de traduction automatique associée à une traduction par le public)

    « Unbabel 2017: A new ecosystem of Machine + Crowd Translation » est un projet mené par Unbabel et cofinancé par le Portugal 2020 – Sistema de Incentivos à Investigação e Desenvolvimento Tecnológico (SI I&DT).

    En savoir plus

Outils libres

  • XCOMET

    XCOMET is a cutting-edge, open-source metric designed to be more interpretable and better aligned with MQM human evaluations. XCOMET combines sentence-level evaluation, similar to neural metrics such as COMET and BLEURT, and error span detection capabilities.

    En savoir plus

  • TowerLLM

    TowerLLM is a suite of multilingual large language models (LLM) optimized for translation-related tasks ranging from pre-translation, to translation and evaluation tasks, such as machine translation (MT), automatic post-editing (APE), and translation ranking. Tower is built on top of LLaMA2 [1], comes in two sizes — 7B and 13B parameters —, and currently supports 10 languages.

    En savoir plus

  • CometKiwi XL

    CometKiwiXL is large language model (LLM) specialized in predicting the quality of a translation. CometKiwi XL (3.5B) and CometKiwi XXL (10.7B) are the open-sourced versions of our state-of-the-art Quality Estimation model.

    En savoir plus

  • MT-Telescope

    MT-Telescope permet de comparer visuellement et avec précision la qualité de deux systèmes de traduction automatique (TA). Il lève le voile sur le score de qualité automatique, permettant aux utilisateurs de filtrer les performances de qualité par mots-clés, terminologie et longueur de segment. MT-Telescope est disponible en tant que source ouverte au profit de l'ensemble de la communauté MT R-D.

  • COMET

    COMET (Crosslingual Optimized Metric for Evaluation of Translation) est un nouveau cadre neuronal pour la formation de modèles d'évaluation de traduction automatique (TA) multilingues. COMET prédit les jugements humains de la qualité de la TA. Ce modèle COMET "prêt à l'emploi" est disponible en tant que source ouverte au profit de l'ensemble de la communauté MT R-D.

  • OpenKiwi

    Quality estimation (QE) is one of the challenges in MT: it evaluates a system’s quality without access to reference translations. We released OpenKiwi, a PyTorch-based open-source framework that implements the best QE systems from WMT 2015-18 shared tasks. The accompanying paper won the best system paper at ACL 2019.

Récompenses

  • Eighth Conference on Machine Translation

    Winners of the WMT 2023 QE Shared Task

  • Eighth Conference on Machine Translation

    Winners of the WMT 2023 Metrics Shared Task

  • COMET22

    Winning submission for the Chinese-English language pair and the second best for the other two language pairs in the WMT2022 Metrics shared task

  • CometKiwi

    Winning submission of the WMT 2022 Quality Estimation (QE) shared task

  • Best Presentation award for the Users and Providers track

    AMTA Conference 2022

  • Best Paper Award

    EAMT Conference 2022 ( Title: Searching for Cometinho: The Little Metric That Could)

  • L'entreprise la plus innovante

    Entreprise la plus innovante (au concours Game Changer Innovation), TAUS (Translation Automation User Society)
    2015, 2017

  • Meilleur système international de Quality Estimation des traductions automatiques

    WMT - Conférence sur la traduction automatique,
    2016, 2019

  • Meilleur système de post-édition automatique pour la traduction automatique globale

    WMT - Conférence sur la traduction automatique,
    2019

  • Prix de la meilleure démonstration de système

    Association for Computational Linguistics (Association pour la linguistique informatique),
    2019

  • Mélanger l'intelligence humaine et l'intelligence artificielle

    Mélanger l'intelligence humaine et l'intelligence artificielle, en partenariat avec Concentrix, Royaume-Uni, National Innovation Awards,
    2019

  • Meilleure innovation en matière de service à la clientèle

    Meilleure innovation en matière de service à la clientèle, en partenariat avec Concentrix, ECCCSA - European Contact Center and Customer Service Awards,
    2019

  • Meilleure utilisation de l'IA et des technologies associées

    Meilleure utilisation de l'IA et des technologies associées, en partenariat avec Microsoft, ECCCSA – European Contact Center et Customer Service Awards,
    2019

  • Les startups les plus innovantes dans le domaine de l'intelligence artificielle Disruptive Technology

    Liste des startups les plus innovantes dans le domaine de l'intelligence artificielle pour la technologie de rupture de l'année, CBInsights,
    2019

  • Les entreprises les plus innovantes

    Liste annuelle de Fast Company des entreprises les plus innovantes du monde pour 2020, Fast Company,
    2020

  • Produit de l'année primé

    Les lauréats du prix du produit de l'année, décerné par le magazine CUSTOMER,
    2021

  • Prix de la meilleure approche en matière d'explicabilité

    Atelier sur l'évaluation et la comparaison des systèmes PNL, co-localisé avec EMNLP,
    2021

Publications

Voir toutes les publications
Duarte M. Alves, José Pombal, Nuno M. Guerreiro, Pedro H. Martins, João Alves, Amin Farajian, Ben Peters, Ricardo Rei, Patrick Fernandes, Sweta Agrawal, Pierre Colombo, José G.C. de Souza, André F.T. Martins | COLM
Duarte M. Alves, Nuno M. Guerreiro, João Alves, José Pombal, Ricardo Rei, José G. C. de Souza, Pierre Colombo, André F. T. Martins | Findings of EMNLP 2023
Ricardo Rei, Nuno M. Guerreiro, José Pombal, Daan van Stigt, Marcos Treviso, Luisa Coheur, José G. C. de Souza, André Martins | WMT 2023
Nuno M. Guerreiro, Ricardo Rei, Daan van Stigt, Luisa Coheur, Pierre Colombo, André F.T. Martins | Association for Computational Linguistics
Manuel Faysse, Patrick Fernandes, Nuno M. Guerreiro, António Loison, Duarte M. Alves, Caio Corro, Nicolas Boizard, João Alves. Ricardo Rei, Pedro H. Martins, Antoni Bigata Casademunt10 François Yvon, André F.T. Martins, Gautier Viaud, Céline Hudelot, Pierre Colombo | TMLR
Nuno M. Guerreiro, Duarte Alves, Jonas Waldendorf, Barry Haddow, Alexandra Birch, Pierre Colombo, André F. T. Martins | TACL Transactions of the Association for Computational Linguistics
Taisiya Glushkova, Chryssa Zerva, Ricardo Rei, André Martins | Findings of the Association for Computational Linguistics: EMNLP 2021
Patrick Fernandes, Kayo Yin, Graham Neubig, André Martins | 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)
Ben Peters, André Martins | 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies
António Lopes, Amin Farajian, Rachel Bawden, Michael Zhang, André Martins | 22nd Annual Conference of the European Association for Machine Translation
António Góis, André Martins | Machine Translation Summit XVII: Research Track
DeutschFrançaisNLdanskSvenskaEnglish