Tech-News-Technologie

Die Video Intelligence API von Google kann Objekte in einem Video erkennen

Das neue Video-Intelligence-Tool von Google kann dank maschinellem Lernen Videos genau so verstehen und analysieren, wie es ein Mensch tun würde.

Google, Google Next, Google Next-Konferenz, Google Next 2017, Next 2017, Google Video Intelligence-Tool, Google API, Google Video-Tool, Google Machine Learning, Technologie, Technologienachrichten(Bildnachweis Google)

Maschinelles Lernen und KI sind die Kernkompetenzen von Google, und dies spiegelt sich in seiner gesamten Palette von Verbraucherprodukten wider. Die intelligente Antwort in Inbox ist die Fähigkeit des Google Assistant, nach Bildern aus einem bestimmten Schlüsselwort oder einer bestimmten Phrase zu suchen. Jetzt möchte Google betonen, dass seine Cloud-Plattform genauso intelligent ist und von Machine-Learning-Tools angetrieben wird, die von Unternehmenskunden verwendet werden können.

Auf der laufenden Next-Konferenz in San Francisco stellte Googles leitender Wissenschaftler für Cloud und maschinelles Lernen, Dr. Fei Fei Li, ein neues Tool vor, mit dem Computer ein Video genau so verstehen und dekodieren können, wie es Menschen tun; die neue Video Intelligence-API. Li, die Leiterin des KI-Labors in Stanford und derzeit für ihre Tätigkeit bei Google ein Sabbatical beurlaubt, wird zugeschrieben, beim Aufbau von ImageNet geholfen zu haben. ImageNet ist eines der größten Repositories für Bilder und wird für maschinelles Lernen und Training von KI verwendet.

Im aktuellen Stand des maschinellen Lernens für Bilder wird Computern beigebracht, ein Objekt zu lernen oder zu verstehen, indem ihnen ständig Bilder desselben Objekts gezeigt werden. Damit der Computer beispielsweise das Bild eines Hundes erkennt, werden dem maschinellen Lernalgorithmus viele Hundebilder angezeigt. Tatsächlich kann die Fotos-App von Google dank der Fortschritte beim maschinellen Lernen Bilder von Lebensmitteln, Hunden oder sogar Katzen erkennen, obwohl sich dies noch in einem Anfangsstadium befindet und weit entfernt von der Art von KI, von der Wissenschaftler träumen.



Während Google gut darin ist, Computern das Verstehen von Bildern beizubringen, sind Videos eine andere Sache. Tatsächlich ist es laut Dr. Li die „dunkle Materie“ des digitalen Universums, aber es sieht so aus, als hätte Google geknackt, wie man einen Teil davon entschlüsselt. Im Wesentlichen wird das neue Video Intelligent-Tool von Google, das sich derzeit in der privaten Betaphase befindet, in der Lage sein, den genauen Teil eines Videos zu identifizieren, den ein Benutzer finden möchte.

Das Tool, das Google Unternehmen zur Verfügung stellen möchte, würde es ermöglichen, dass Videos durchsucht und gefunden werden können, genau wie Fotos derzeit in der Google Fotos-App. In seiner Demo während der Keynote zeigte Google, wie das Tool genaue Labels herausfinden kann; Bei der Aufforderung, einen Strand oder Baseball aus einer Reihe von Videos zu finden, war das Tool in der Lage, genau zu lokalisieren, welche Clips Bilder eines Strandes/Baseballs enthielten und an welchen Stellen.

Im Wesentlichen würde ein Benutzer dank des Tools jede Aufnahme und jeden Frame durchsuchen, ohne sich manuell darauf verlassen zu müssen, um das genaue Videomaterial zu finden.

Laut Google kann die API in Google Cloud Storage gespeicherte Videos mit Anmerkungen versehen und jedes der Objekte beschriften. Die Kennzeichnung bedeutet, dass die täglichen Gegenstände oder Gegenstände im Video erkannt werden können. Selbst wenn Ihre Clips zufällig benannt sind, können Sie mit dem Tool beispielsweise nach Filmmaterial von einem Strand suchen, wie Google in der Demo gezeigt hat.

Google sagt auch, dass das Tool Szenenänderungen innerhalb des Videos erkennen kann und Unternehmen bei der Medienarchivierung helfen und die Inhaltserkennung für Videos verbessern kann. Diese API basiert auf den aktuellen Seherkennungsmodellen von Google, die auch die Videosuche in YouTube vorantreiben.

Google kündigte auch Verbesserungen an seiner Cloud Vision API an, die eine Erweiterung von Metadaten aus dem Wissensgraphen des Unternehmens umfassen. Im Wesentlichen bringt Google seine Erfolge auf der Verbraucherseite des Geschäfts ein und bietet sie Unternehmen an, um im Rennen um die Cloud mit Amazon und Microsoft gleichzuziehen.

Haftungsausschluss: Der Korrespondent nimmt auf Einladung von Google India an der Next-Konferenz in San Francisco teil, die für Reise und Unterkunft bezahlt.