Alibaba-NLP 04.07.2019, 17:49 Uhr

Besser als ein Mensch

Beim Leseverständnis-Test "MS MARCO" von Microsoft hat die Sprachverarbeitungskomponente des Alibaba DAMO Academy Language Technology Labs "besser als ein Mensch" abgeschnitten.

(Quelle: https://damo.alibaba.com/)

Das Alibaba DAMO Academy Language Technology Lab, bei Alibaba für die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) zuständig, hat ein Deep-Learning-Modell entwickelt, das im neuesten maschinellen Leseverständnis-Test MS MARCO von Microsoft bei einer Frage-und-Antwort-Aufgabe besser abschneidet als ein Mensch.

Die Leistung zeigt das Potenzial von Maschinen, große Mengen komplexer Materialien zu verstehen und komplizierte Fragen im wirklichen Leben zu beantworten. Die Anwendung der Technologie ist breit gefächert, vom intelligenten Chatbot bis zur Suchmaschine, die direkt antworten und nicht nur Links zu Webseiten liefern kann.Dr. Luo Si, Leiter des Alibaba DAMO Academy Language Technology Lab, kommentiert: „Wir sind begeistert von der rasanten Entwicklung von NLP im vergangenen Jahr und den spannenden Perspektiven der Technologie im realen Einsatz. NLP ist eine Kerntechnologie, die das Geschäft von Alibaba unterstützt, um Hunderte von Millionen von Kunden auf unseren E-Commerce-Plattformen wie Taobao, Tmall und Lazada zu bedienen. In Zukunft planen wir, NLP auf unserer Cloud-Computing-Plattform Alibaba Cloud einzuführen. Damit können mehr Kunden, insbesondere Unternehmen aus den Bereichen Einzelhandel oder Tourismus, von der Technologie profitieren. Wir untersuchen auch ein Multi-Modul-Modell, das die Funktionen von NLP, Sprach-KI und maschineller Übersetzung kombiniert. Mit einem solchen Modell können Benutzer in verschiedenen Sprachen freier miteinander kommunizieren und in Echtzeit ohne Sprachbarrieren mit der Maschine interagieren.“

MS MARCO war bereits der zweite renommierte Test, in dem das Sprachforschungsteam von Alibaba den ersten Platz in einem führenden Maschinenverständnistest belegte. Bereits im vergangenen Jahr hatte das Modell auch beim Leseverständnis-Test SQuAD der Stanford University eine höhere Punktzahl als ein Mensch erzielt.Im Vergleich zu SQuAD fügte der MS MARCO-Test weitere Herausforderungen hinzu: Die Teilnehmer müssen etwa 1.000 Dokumente auf der Grundlage des Bing-Suchdatensatzes von Microsoft durchgehen, um zuerst relevante Passagen und dann die richtigen Antworten auf die gestellten Fragen zu finden oder sogar selbst zu entwickeln. Die Teilnehmer bei SQuAD müssen „nur“ nach Antworten aus einem einzigen Dokument suchen. Das bedeutet, dass der MS MARCO-Test tatsächlich näher an realen Szenarien liegt, in denen Entscheidungen meist aus mehreren Quellen und einer Vielzahl von Materialien getroffen werden.Die NLP-Technologie kommt auf den E-Commerce-Plattformen von Alibaba bereits täglich zum Einsatz. So erreichte beispielsweise das von der Technologie unterstützte Chatbot-System während einer Online-Verkaufs-Veranstaltung auf Lazada, dem Marktplatz der Alibaba Group für Südostasien, im vergangenen Jahr eine Genauigkeit von 96 Prozent bei der Beantwortung von Kundenanfragen. Es dauerte nur 30 Millisekunden, bis der Chatbot alle Regeln für 25 Werbeartikelverkäufen auf Indonesisch erlernte.Das im MS MARCO-Test verwendete Modell wurde von den Alibaba-Forschern zunächst als tiefes Kaskadenmodell entwickelt. Es wurde dann in Alibabas „AliMe“ Chatbot-System getestet, um bei Online-Anfragen von über zwei Millionen täglichen Besuchern auf den Handelsplattformen des Unternehmens zu unterstützen. Später wurde ein angereichertes BERT-Modell („Bidirectional Encoder Representations from Transformers“) entwickelt, um sowohl die Genauigkeit als auch die Effizienz des Maschinenverständnisses zu verbessern. Derzeit liegt das BERT-Modell in einem weiteren hochklassigen Sprachtest, dem von DeepMind mitorganisierten GLUE Benchmark, unter den Top Fünf.Darüber hinaus gewann das Alibaba-Forschungsteam auch fünf Kategorien für maschinelle Übersetzungen – Englisch-Chinesisch, Englisch-Russisch, Russisch-Englisch, Englisch-Türkisch und Türkisch-Englisch – bei WMT2018, einem führenden maschinellen Übersetzungswettbewerb, der von Hochschulen und Forschungseinrichtungen aus Europa organisiert wird.

Weitere Informationen zur DAMO Academy finden Sie auf dieser Website oder auf Alizila, dem offiziellen Blog der Alibaba Group.

Autor(in) Bernhard Lauer