Vi har fört samman ett mångsidigt team av experter inom AI och bearbetning av naturligt språk. Deras ojämförbara forskning och prisbelönta genombrott fortsätter att sätta industristandarder och tar oss närmare vår vision: att skapa en värld utan språkbarriärer.
Ledande röster på området
Vårt forskarteam förändrar sättet som människor kommunicerar på
-
João Graça
Medgrundare och teknisk chef
-
André Martins
Vice direktör för forskning
-
Paulo Dimas
Vice direktör för produktinnovation
-
José Souza
Staff AI Research Scientist
-
M. Amin Farajian
Specialforskare inom AI
-
Fabio Kepler
Specialforskare inom AI
-
Ricardo Rei
Specialforskare inom AI
-
Catarina Farinha
AI Research Manager
-
João Alves
AI-forskare
-
Daan van Stigt
Specialforskare inom AI
-
Maria Ana Henriques
FoU-projektledare
-
Nuno André
Senior Grants Coordinator
-
Vera Cabarrão
Senior AI Quality Manager
-
Marina Sánchez Torrón
Förste analytiker av naturligt språk
-
Marianna Buchicchio
Senior Manager AI Quality
-
Maximilian Kohl
Högre produktchef
-
João Godinho
Förste AI-forskningsingenjör
-
Pedro Mota
Förste AI-forskningsingenjör
-
Nuno Guerreiro
AI-forskare
-
José Pombal
AI-forskare
-
Pedro Martins
Specialforskare inom AI
-
Muhammad Bilal
Senior Backend Engineering Manager
Projekt
Center for Responsible AI
The Center for Responsible AI is one of the largest centers dedicated to Responsible AI, bringing together ten startups, eight research centers, a law firm, and five industry leaders, that will collaborate to develop 21 innovative AI products leveraged by Responsible AI technologies such as equity, explainability, and sustainability. The center is co-funded by the Portuguese PRR.
UTTER
UTTER – Unified Transcription and Translation for Extended Reality – is a collaborative Research and Innovation project funded under Horizon Europe that aims to leverage large language models to build the next generation of multimodal eXtended reality (XR) technologies for transcription, translation, summarisation, and minuting. UTTER’s use-case prototypes will cover (i) a personal assistant for meetings that can improve communication in the online world and (ii) an advanced customer service assistant to support global markets.
QUARTZ
QUARTZ ("Quality-Aware maskinöversättning") är ett banbrytande forskningsprojekt som finansieras av ELISE Open Call för att bygga upp Responsible MT för samtalsdata: högkvalitativ MT för att öppna upp nya marknader där kritiska MT-fel inte kan tolereras.
MAIA
MAIA kommer att använda avancerad teknik för maskininlärning och behandling av naturligt språk för att bygga flerspråkiga AI-assistenter som eliminerar språkbarriärer. MAIA:s översättningsskikt kommer att göra det möjligt för mänskliga agenter att ge kundsupport i realtid, på alla språk och med mänsklig kvalitet.
Användarfokuserad Marian
Improve the pre-existing neural machine translation toolkit “Marian” to address the needs of CEF eTranslation and to broaden its user base (H2020 Co-Funded Project). Terminology, on-the-fly domain adaptation, better documentation and GPU optimization are the focus areas in this Marian iteration.
MT4ALL
Aims at building data for under-resourced languages in fields of public interest, such as Health and Justice. It’ll contribute to the CEF Automated Translation Building block by enlarging its coverage for language pairs and domains for which parallel data does not exist (H2020 Co-Funded Project).
Unbabel4EU
We’re working on advancing European language engines for borderless business communication. Create Europe’s Translation Layer, specifically, by enabling seamless human-quality translation between any pairing of the 24 official languages of the EU in different content types such as Email, Chat and Listings (P2020 Co-Funded Project).
APE-QUEST
Setting up a quality gate and crowdsourcing workflow to improve translation quality in specific domains. Boost CEF eTranslation with Automated Post-Editing (APE) & Quality Estimation (QE) for Electronic Exchange of Social Security Information (EESSI) and Online Dispute Resolution (ODR) DSIs and related national services (H2020 Co-Funded Project).
INTERACT
Snabb och korrekt kommunikation är avgörande för krishantering, men vad händer om den enda information du har tillgång till är på ett språk som du inte förstår? INTERACT är ett tvärvetenskapligt europeiskt projekt som skapats för att tillgodose behovet av kvalitetsöversättning i krissituationer på hälsoområdet.
Unbabel Scribe
Transcription can be a big piece of translation flows, especially when it comes to audiovisual content. This project aims to research & develop a technical solution for automatic transcription and translation of audiovisual content by leveraging a community of human translators (P2020 Co-Funded Project).
DeepSPIN
Djupinlärning håller på att revolutionera området för bearbetning av naturligt språk (NLP), med genombrott inom maskinöversättning, taligenkänning och svar på frågor. Nya språkgränssnitt (digitala assistenter, Messenger-appar, kundtjänstrobotar) är på väg att bli nästa teknik för sömlös, flerspråkig kommunikation mellan människor och maskiner.
Unbabels internationaliseringsplan
Unbabel’s Internationalization Plan (“Unbabel 2017-2019: Plano de Internacionalização”) is a project led by Unbabel and co-funded by Portugal 2020 – Sistema de Incentivos à Internacionalização das PME.
Unbabel 2017: A new ecosystem of Machine + Crowd Translation
“Unbabel 2017: A new ecosystem of Machine + Crowd Translation” är ett projekt som leds av Unbabel och samfinansieras av Portugal 2020 – Sistema de Incentivos à Investigação e Desenvolvimento Tecnológico (SI I&DT)
Projekt och publikationer
MT-Telescope
MT-Telescope ger en detaljerad visuell jämförelse av kvalitetsprestandan för två maskinöversättningssystem. Den lyfter på huven på den automatiska kvalitetsbedömningen och gör det möjligt för användare att filtrera kvalitetsprestanda efter nyckelord, terminologi och segmentlängd. MT-Telescope är tillgänglig som öppen källkod för att gynna den bredare MT FoU-gemenskapen.
COMET
COMET (Crosslingual Optimized Metric for Evaluation of Translation) är ett nytt neuralt ramverk för utbildning av flerspråkiga utvärderingsmodeller i maskinöversättning. COMET förutsäger mänskliga bedömningar av MT-kvalitet. Denna "färdiga COMET-modell" är tillgänglig som öppen källkod för att gynna den bredare MT FoU-gruppen.
MAIA
MAIA kommer att använda avancerad teknik för maskininlärning och behandling av naturligt språk för att bygga flerspråkiga AI-assistenter som eliminerar språkbarriärer. MAIA:s översättningsskikt kommer att göra det möjligt för mänskliga agenter att ge kundsupport i realtid, på alla språk och med mänsklig kvalitet.
Användarfokuserad Marian
Improve the pre-existing neural machine translation toolkit “Marian” to address the needs of CEF eTranslation and to broaden its user base (H2020 Co-Funded Project). Terminology, on-the-fly domain adaptation, better documentation and GPU optimization are the focus areas in this Marian iteneration.
MT4ALL
Aims at building data for under-resourced languages in fields of public interest, such as Health and Justice. It’ll contribute to the CEF Automated Translation Building block by enlarging its coverage for language pairs and domains for which parallel data does not exist (H2020 Co-Funded Project).
Unbabel4EU
We’re working on advancing European language engines for borderless business communication. Create Europe’s Translation Layer, specifically, by enabling seamless human-quality translation between any pairing of the 24 official languages of the EU in different content types such as Email, Chat and Listings (P2020 Co-Funded Project).
OpenKiwi
Quality estimation (QE) is one of the challenges in MT: it evaluates a system’s quality without access to reference translations. We released OpenKiwi, a PyTorch-based open-source framework that implements the best QE systems from WMT 2015-18 shared tasks. The accompanying paper won the best system paper at ACL 2019.
APE-QUEST
Setting up a quality gate and crowdsourcing workflow to improve translation quality in specific domains. Boost CEF eTranslation with Automated Post-Editing (APE) & Quality Estimation (QE) for Electronic Exchange of Social Security Information (EESSI) and Online Dispute Resolution (ODR) DSIs and related national services (H2020 Co-Funded Project).
INTERACT
Snabb och korrekt kommunikation är avgörande för krishantering, men vad händer om den enda information du har tillgång till är på ett språk som du inte förstår? INTERACT är ett tvärvetenskapligt europeiskt projekt som skapats för att tillgodose behovet av kvalitetsöversättning i krissituationer på hälsoområdet.
Unbabel Scribe
Transcription can be a big piece of translation flows, especially when it comes to audiovisual content. This project aims to research & develop a technical solution for automatic transcription and translation of audiovisual content by leveraging a community of human translators (P2020 Co-Funded Project).
DeepSPIN
Djupinlärning håller på att revolutionera området för bearbetning av naturligt språk (NLP), med genombrott inom maskinöversättning, taligenkänning och svar på frågor. Nya språkgränssnitt (digitala assistenter, Messenger-appar, kundtjänstrobotar) är på väg att bli nästa teknik för sömlös, flerspråkig kommunikation mellan människor och maskiner.
Verktyg med öppen källkod
XCOMET
XCOMET is a cutting-edge, open-source metric designed to be more interpretable and better aligned with MQM human evaluations. XCOMET combines sentence-level evaluation, similar to neural metrics such as COMET and BLEURT, and error span detection capabilities.
TowerLLM
TowerLLM is a suite of multilingual large language models (LLM) optimized for translation-related tasks ranging from pre-translation, to translation and evaluation tasks, such as machine translation (MT), automatic post-editing (APE), and translation ranking. Tower is built on top of LLaMA2 [1], comes in two sizes — 7B and 13B parameters —, and currently supports 10 languages.
CometKiwi XL
CometKiwiXL is large language model (LLM) specialized in predicting the quality of a translation. CometKiwi XL (3.5B) and CometKiwi XXL (10.7B) are the open-sourced versions of our state-of-the-art Quality Estimation model.
MT-Telescope
MT-Telescope ger en detaljerad visuell jämförelse av kvalitetsprestandan för två maskinöversättningssystem. Den lyfter på huven på den automatiska kvalitetsbedömningen och gör det möjligt för användare att filtrera kvalitetsprestanda efter nyckelord, terminologi och segmentlängd. MT-Telescope är tillgänglig som öppen källkod för att gynna den bredare MT FoU-gemenskapen.
COMET
COMET (Crosslingual Optimized Metric for Evaluation of Translation) är ett nytt neuralt ramverk för utbildning av flerspråkiga utvärderingsmodeller i maskinöversättning. COMET förutsäger mänskliga bedömningar av MT-kvalitet. Denna "färdiga COMET-modell" är tillgänglig som öppen källkod för att gynna den bredare MT FoU-gruppen.
OpenKiwi
Quality estimation (QE) is one of the challenges in MT: it evaluates a system’s quality without access to reference translations. We released OpenKiwi, a PyTorch-based open-source framework that implements the best QE systems from WMT 2015-18 shared tasks. The accompanying paper won the best system paper at ACL 2019.
Utmärkelser
Eighth Conference on Machine Translation
Winners of the WMT 2023 QE Shared Task
Eighth Conference on Machine Translation
Winners of the WMT 2023 Metrics Shared Task
COMET22
Winning submission for the Chinese-English language pair and the second best for the other two language pairs in the WMT2022 Metrics shared task
CometKiwi
Winning submission of the WMT 2022 Quality Estimation (QE) shared task
Best Presentation award for the Users and Providers track
AMTA Conference 2022
Best Paper Award
EAMT Conference 2022 ( Title: Searching for Cometinho: The Little Metric That Could)
Det mest innovativa företaget
Det mest innovativa företaget (vid Game Changer Innovation Contest), TAUS (Translation Automation User Society)
2015, 2017Bästa Quality Estimation system för global maskinöversättning
WMT - Konferens om maskinöversättning,
2016, 2019Bästa globala system för automatisk efterbearbetning av maskinöversättning
WMT - Konferens om maskinöversättning,
2019Pris för bästa systemdemonstration
Association for Computational Linguistics,
2019Att blanda människa och artificiell intelligens
Att blanda människa och artificiell intelligens, i samarbete med Concentrix, UK, National Innovation Awards,
2019Bästa innovation inom kundtjänst
Bästa innovation inom kundtjänst, i samarbete med Concentrix, ECCCSA - European Contact Center and Customer Service Awards,
2019Bästa användning av AI och tillhörande teknik
Bästa användning av AI och tillhörande teknik, i samarbete med Microsoft, ECCCSA – European Contact Center och Customer Service Awards,
2019De mest innovativa nystartade företagen inom artificiell intelligens för omvälvande teknik
Lista över de mest innovativa nystartade företagen inom artificiell intelligens för årets omvälvande teknik, CBInsights,
2019De mest innovativa företagen
Fast Companys årliga lista över världens mest innovativa företag för 2020, Fast Company,
2020Vinnare av utmärkelsen Årets produkt
Vinnare av utmärkelsen Årets produkt, presenterad av tidningen CUSTOMER,
2021Bäst Explainability Approach Award
Workshop om utvärdering och jämförelse av system för bearbetning av naturligt språk, samlokaliserad med EMNLP,
2021