Sprachsteuerung: Was gibt es und wie funktioniert sie

Geschrieben von

sprachsteuerung

Jedes halbwegs gute Android-Smartphone wird mittlerweile mit der Sprachsteuerung Google Now ausgeliefert, die das Suchen und Steuern des Smartphones per Sprachkommandos erlaubt. Google Now ist aber nicht die einzige Software, die das erlaubt. Es haben sich zahlreiche Alternativen entwickelt und Smartphone-Hersteller spielen das Spielchen gerne mit.

Den Hype um Sprachsteuerung am Smartphone hat, wie hätte es anders sein können, Apple im Jahre 2012 mit iOS 5 und dem darin enthaltenen Sprach-Assistenten Siri für das iPhone 4S und neuer entfacht. Klar das die Android-Konkurrenz da nicht zurückstehen durfte, allen voran die südkoreanischen Konzerne Samsung und LG. Allerdings beherrscht Android von Haus aus bereits diverse Sprachkommandos und das seit seinem Beginn. Über die Jahre hat sich diese jedoch ungemein weiterentwickelt und ist heute Teil von Google Now, was Siri sein will aber in besser. Darüber kann man sich zwar streiten aber Fakt ist, Sprachsteuerung des Smartphones hat sich zu einem festen Bestandteil entwickelt. Leider kocht mancher sein eigenes Süppchen, weswegen wir mal einen kleinen Blick auf die verfügbaren Lösungen und deren Funktionen werfen wollen.

 

Funktionsweise eines Sprachassistenten

Grundsätzlich funktioniert jeder Sprachassistent nach demselben Grundprinzip: Die Sprachbefehle werden aufgenommen, in ein spezielles komprimiertes Format codiert und dann die jeweiligen Server hinter dem Dienst übermittelt. Diese Server-Farmen werten die übertragenen Daten aus und senden die jeweils passende Antwort zurück an das Smartphone oder Tablet.

Damit ein Sprachassistent überhaupt funktioniert ist eine aktive Online-Verbindung notwendig, sei es über WLAN oder HSPA bzw. LTE. Offline-Erkennung gibt es nicht, dazu reicht die Rechenleistung moderner Prozessoren für Smartphones und Tablets nicht aus. Also wird die benötigte Rechenkraft auf Server-Farmen ausgelagert und das Ergebnis direkt an das Gerät zurück geschickt. Je nach Algorithmus hinter den einzelnen Lösungen ist die Erkennung der Wörter mehr oder weniger genau.

 

Apple Siri

Der Klassiker schlechthin dürfte der Sprachassistent Siri sein, auch wenn Siri bei Weitem nicht die erste App ihrer Art ist. Aber wie das bei Apple halt öfters mal der Fall ist, machen die Kalifornier gerne mal den Vorreiter für diverse Dinge und das recht erfolgreich. Siri gehört zu solchen Erfolgen. Je nach Inhalt der Frage ist Siri sogar in der Lage ganze Gespräche zu führen, ganz so als ob man wirklich mit einer künstlichen Intelligenz spricht.

Siri ist kompatibel mit Geräten ab dem iPhone 4S, dem iPad der dritten Generation, iPad Mini und dem iPod Touch der fünften Generation.

 

Google Sprachsuche / Google Now

Die Google Sprachsuche ist seit der ersten Version auf dem T-Mobile G1 Bestandteil von Android, um die Suche im Web bequemer zu starten. Mittlerweile ist die Google Sprachsuche im Sprachassistenten Google Now integriert, sodass der Funktionsumfang enorm zugelegt hat. Die neue Oberfläche zeichnet sich durch Karten aus, deren Inhalte sich dynamisch ändern, je nachdem was für Termine anstehen oder wo man sich befindet. Im Gegensatz zu Siri basiert Google Now auf dem Google Knowledge Graph, um Millionen von Datensätzen logisch miteinander zu verknüpfen. Dadurch sind unter anderem Folgefragen möglich.

Das und die sehr natürliche Sprachausgabe von Google Now führte unter anderem dazu, dass Google Now als Innovation des Jahres ausgezeichnet wurde. Außerdem führt Google immer wieder mal kleine Späßchen ein, wie die Karaoke.Funktion für Weihnachtslieder. Da Google Now dermaßen gut funktioniert, hat Motorola kurzerhand die Sprachsteuerung von Google als Standard vorinstalliert, mit einigen eigenen Erweiterungen wie Touchless Control.

Was mit Google Now bereits alles in Deutschland funktioniert, haben wir mal für euch ein wenig ausprobiert.

Google
Entwickler: Google Inc.
Preis: Kostenlos

 

Samsung S Voice

Bei Samsung S Voice handelt es sich um dasselbe Prinzip wie bei Siri und Google Now. Auch hier geht die Sprachsteuerung weit über die Suche hinaus. Telefonate starten, SMS, E-Mail, Termine und Notizen verfassen oder einfach nur eine App starten. Weiterhin lässt sich per S-Voice die Navigation starten, der Wecker, ein Timer, Funkverbindungen wie WLAN oder Bluetooth oder Status-Updates zu Twitter und Facebook übertragen. S Voice greift unter anderem für manche Fragen auf die semantische Suchmaschine Wolfram|Alpha zurück.

Samsung S-Voice ist wie der Name schon sagt nur auf bestimmten Smartphones des Konzerns vorinstalliert.

 

LG Quick Voice

Quick Voice bzw. Q Voice von LG ist dasselbe wie die Sprachsteuerung der Konkurrenz, sowohl was Nutzung als auch Funktionsumfang betrifft. Auch bei LGs Implementation kann mittels natürlicher Sprache im Internet suchen, Termine erstellen, Musik oder Apps starten. Der Sprachassistent ist auf diversen LG-Geräten vorinstalliert und kann beispielsweise über die QuickMemo-Taste gestartet werden. Dazu muss man allerdings vorher die Tasten-Belegung von QuickMemo anpassen.

Die Nachfolge-App wird kommendes Jahr als LG VoiceMate erwartet, deren erste Vorläufer auf dem LG G2 implementiert sind.

 

ZTE My Drive

Die neuste Hersteller-eigene Lösung zur Sprachsteuerung kommt von ZTE, härt auf den Namen My Drive und wurde zur CES 2014 zusammen mit dem ZTE Grand S II vorgestellt. Die große Neuerung ist das Antrainieren der eigenen Stimme, sodass sich das Smartphone per definiertem Sprachbefehl entsperren lässt. Wahlweise können auch Freunde oder Familienmitglieder angelernt werden, um das Gerät zu entsperren. Außerdem legt ZTE den Fokus der Sprachsteuerung auf den Einsatz im Auto, unter anderem durch eine Steigerung der Erkennungsrate. Das zeichnet sich dadurch aus, dass Telefonate per Sprache angenommen oder abgelehnt werden oder SMS-Nachrichten sich vorlesen lassen. Per „Nicht stören“-Funktion werden Anrufe automatisch auf den Anrufbeantworter umgeleitet.

 

Sprachsteuerung-Alternativen

Freilich gibt es noch weitere Apps, die als Alternative zu Siri, S Voice und Google Now fungieren. Allerdings mit mehr oder minder großem Funktionsumfang und Zuverlässigkeit, was die Erkennung der Sprache betrifft. Auch hier wird eine aktive Online-Verbindung vorausgesetzt. In der Regel orientieren sich diese Alternativen an Siri von Apple, da es nun mal das Original ist. Übrigens arbeitet selbst Microsoft an einer Sprachsteuerung für die eigene Windows-Phone-Plattform namens Cortana und auch Yahoo hat angeblich etwas in der Mache.

Alicoid
Entwickler: KKdevs
Preis: 2,99 €
  • Alicoid Screenshot
  • Alicoid Screenshot
  • Alicoid Screenshot
  • Alicoid Screenshot
  • Alicoid Screenshot
  • Alicoid Screenshot
  • Alicoid Screenshot
  • Alicoid Screenshot
Die App konnte im App Store nicht gefunden werden. 🙁 #wpappbox

Links: → Store öffnen → Google-Suche
AIVC (Alice)
Entwickler: YourApp24
Preis: Kostenlos
  • AIVC (Alice) Screenshot
  • AIVC (Alice) Screenshot
  • AIVC (Alice) Screenshot
  • AIVC (Alice) Screenshot
  • AIVC (Alice) Screenshot
  • AIVC (Alice) Screenshot
  • AIVC (Alice) Screenshot
  • AIVC (Alice) Screenshot
Die App konnte im App Store nicht gefunden werden. 🙁 #wpappbox

Links: → Store öffnen → Google-Suche
Genie
Entwickler: Pannous
Preis: Kostenlos+
  • Genie Screenshot
  • Genie Screenshot
  • Genie Screenshot
  • Genie Screenshot
  • Genie Screenshot
DE-Cyberon Voice Commander
Entwickler: Cyberon Corp.
Preis: 4,81 €
  • DE-Cyberon Voice Commander Screenshot
  • DE-Cyberon Voice Commander Screenshot
SHERPA ¿Para qué preguntas?
Entwickler: SHERPA
Preis: Kostenlos
  • SHERPA ¿Para qué preguntas? Screenshot
  • SHERPA ¿Para qué preguntas? Screenshot
  • SHERPA ¿Para qué preguntas? Screenshot
  • SHERPA ¿Para qué preguntas? Screenshot

The following two tabs change content below.
Mann mit Bart und Faible für Smartphones und Tablets jeder Plattform, doch eindeutig bekennender Androidliebhaber.

3 Kommentare

  1. Verstehe nicht das es auch bei Lollipop noch immer keine Funktion gibt, offline eine SMS zu diktieren oder jemanden anzurufen zu lassen oder ein Memo zu diktieren.
    Immerhin gibt es ja offline Spracherkennung Apps wie zb.ListNote , da funktioniert das offline diktieren wunderbar. Oder Digital Timer, dort funktioniert zb die offline Zahlen Erkennung klasse.
    Es könnte wirklich mal langsam ein Update geben, damit man mit s voice oder Google Now wenigstens ein klein wenig offline Abrbeiten könnte! Oder sind die online Benutzerdaten interessanter und es Bedarf dazu weiter extra 10 kleine Zusatz Apps!

  2. Grem schreibt:

    Offline Spracherkennung scheitert an Prozessorleistung?
    Kurz gelacht….
    Eten Glofish X650 unter Windows Mobile mit Cyberon Voice Commander lies sich hervorragend per Sprachsteuerung bedienen, sogar mit Motorradheadset in Fahrt. Gleiche App auf Android voller Reinfall. Und nun geht auf dem tollen Samsung offline immer noch nichts. TOTALER Rückschritt in die Steinzeit…
    Datenverbindung gibts halt in unserem tollen Deutschland nicht flächendeckend…

    • Bei den „alten“ Lösungen aus Windows-Mobile-Zeiten (hach waren das geile Zeiten mit dem HD2 und Konsorten *ggg*) wie von Cyberion hast du ein Sprachfile angelegt für den jeweiligen Befehl und entweder passte der erkannte Befehl dann überein oder eben nicht. Moderne Sprachsteuerungssysteme wie Siri oder Google Now verstehen hingegen wirklich natürliche Sprache – du kannst ganz normal und mit verschiedenen Formulierungen mit denen quatschen – und können diese auch interpretieren. Die dazu nötige Rechenleistung der Smartphone-Prozessoren reicht aber nicht aus, um in annehmbarer Zeit die gewünschten Ergebnisse zu liefern.

      Es sei denn man kann die für derartige Berechnungen erheblich effizientere GPU des SoC nutzen, siehe das Forschungsprojekt mit einem NVIDIA Tegra X1 der Carnegie Mellon University und Ford:
      http://www.go2android.de/ford-will-nvidia-tegra-k1-fuer-sprachsteuerung-nutzen/

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*


233 Abfragen in 0,947 Sekunden