SEO / trafficmaxx 17. November 2014

Gut oder Schlecht? Google Snippet-Optimierung durch Sonderzeichen

Wer aufmerksam im Internet unterwegs ist, dem sind sie sicher schon das eine oder andere Mal vor die Füße gefallen: Unicode Dingbats und Piktogramme, die mehr sind als reine Schriftzeichen. Besonders beliebt und häufig verwendet werden vor allem die Piktogramme, die von Unicode als „Miscellaneous Symbols“ oder unter UFT-8 als „Dingbats“ zusammengefasst werden. Aber worum genau handelt es sich bei diesen besonderen Unicode-Characters eigentlich und wann kann man sie benutzen? Um dieses schon fast uralte Thema zu verstehen, muss man erst einmal ein bisschen was über Zeichencodierung wissen…

ASCII – Der Großvater der digitalen Codierung

Der 1963 veröffentlichte American Standard Code for Information Interchange (ASCII) ist eine 7-Bit-Kodierung und bestand zunächst aus nur 128 Zeichen, die dem Zeichensatz der englischen Sprache entsprachen. 95 der Zeichen waren druckbare Zeichen und umfassten das lateinische Alphabet in Groß- und Kleinschreibung, zehn arabische Ziffern, sowie die wichtigsten Satzzeichen. Die restlichen 33 Zeichen waren nicht druckbare Steuer- und Protokollzeichen wie Zeileneinschübe, Übertragungsende, Bestätigung, Trennzeichen oder Tabulatoren.

ASCII-Zeichensatz-Tabelle

Mit dieser Codierung war das Grundgerüst für folgende Zeichencodierungen gelegt. Zunächst jedoch wurde der ASCII, dessen Codierungsmöglichkeiten mit 128 Byte erst zur Hälfte ausgeschöpft waren (7-Bit-Kodierung), um weitere Zeichensätze ergänzt. Später wurde ASCII sogar noch auf 8-Bit erweitert, um noch mehr Zeichen codieren zu können. Die beiden meist verwendeten Ergänzungen sind OEM und ANSI.

OEM,ANSI und ISO – Die ersten Erweiterungspakete

OEM war der erste erweiterte Zeichensatz zu ASCII mit dem auch die ersten Rechner des Typs IBM PC ausgestattet waren. OEM wird von PC-kompatibler Hardware in starker Mehrheit verwendet. Er enthält einige fremdartige Zeichen, die unter anderem Felder markieren können.

OEM-Zeichensatz-Tabelle

Mit ANSI (American National-Standards Institute) wurde der ASCII-Zeichensatz so weit wie möglich mit den gängigsten Zeichen vervollständigt. Es ist heute der Zeichensatz, der sich bei den meisten modernen Betriebssystemen durchgesetzt hat.

ANSI-Zeichensatz-Tabelle

Doch auch mit diesen Erweiterungen konnten noch lange nicht alle Schriftzeichen aller Sprachen abgedeckt werden. Aus dem Bedarf weitere Zeichen abzubilden, wurden Normserien mit länderspezifischen Zeichensätzen – die ISO-Zeichensätze – entwickelt. Von den aktuell 15 verschiedenen 8-Bit ISO-Zeichensätzen ist der wohl wichtigste ISO 8859-1, der in Kombination mit dem 7-Bit-ASCII-Code die Schriftzeichen von über 20 Sprachen darstellen kann. Einige der ISO-Zeichensätze enthalten zusätzliche mathematische Symbole oder sogar schon erste Dingbats wie Herzen und Pfeile. Kreative Köpfe haben schon in diesen Erweiterungen kreatives Potential gesehen und angefangen mit den Zeichen und Symbolen dieser Schriftsätze Figuren und Smilys zu bilden:

smily-faces1

Unicode – Alles unter einem Dach

Durch die zunehmende Globalisierung wurden unterschiedliche Zeichensätze für die verschiedenen Schriftarten in den 80er und 90er Jahren jedoch mehr und mehr zum Problem, da für multilinguale Texte, die beispielsweise chinesische Schriftzeichen enthielten mehrere Zeichensätze eingebunden werden mussten. Unicode ist der Versuch alle Schriftzeichen und Symbole der Welt in einem großen Zeichensatz zu vereinen. Anfänglich als 16-Bit Zeichensatz geplant, sprengten die Zeichen aller toten und lebendigen Schriften schnell den Rahmen und woraufhin Unicode auf 32-Bit erweitert wurde. 2014 umfasste Unicode ca. 113.000 Zeichen und Symbole aus 123 Schriftsystemen. Die vollständige Liste kann auf Unicode eingesehen werden. Da der codierbare Zeichenvorrat 2^32(4.294.967.296) beträgt, ist das Projekt noch lange nicht an seine Grenzen gestoßen. Durch den Unicode eröffneten sich jedoch auch völlig neue Möglichkeiten zur Expression im Internet. Neue Emoticons flossen ebenso und wie weitere genau definierte Dingbats ein, darunter Symbole für Telefone, Blumen, Herzen, Kreuze und Sterne. Viele der Dingbats werden von den unterschiedlichsten Schriftarten unterstützt, einige können jedoch nur von wenigen Schriften dargestellt werden und sind daher zur Verwendung im Internet eher ungeeignet, da sie nicht bei allen Nutzern angezeigt werden. Besonders beliebt ist der Einsatz von ausländischen Schriftzeichen mit künstlerischem Charakter oder mathematischen Symbolen in Kombination mit den verschiedenen Dingbats um neue Formen und Expressionen zu finden:

smily-faces2

UTF-8 – Der angestrebte Standard

UTF-8 (8-Bit Unicode Transformation Format) ist heute im Internet die gebräuchlichste und populärste Kodierung für Unicode-Zeichen. In UTF-8 können bis zu 1.000.000 Zeichen mit variabler Codelänge von einem bis vier Byte gespeichert werden. Das ist nötig um fremde, komplexe Ideogramme darzustellen, wie Beispielsweise chinesische Schriftzeichen (4 Bytes) und hat den Vorteil, dass einfach Buchstaben mit nur einem Byte dargestellt werden können. Deutsche Umlaute werden in UTF-8 übrigens im Gegensatz zu ANSI und OEM mit zwei Bytes statt mit einem kodiert – das ist der einzige Unterschied zu ASCII und wahrscheinlich auch der Ursprung der Fehleinschätzung, dass UTF-8 keine Umlaute darstellen könnte. Der durchschnittliche Speicherplatz bei UFT-8 beträgt pro Schriftzeichen 1.1 Byte, da die meisten Zeichen sich im westeuropäischen und amerikanischen Sprachraum verorten lassen, deren Codierung mit einem Byte erfolgt. So ist UTF-8 vom Speicherbedarf her fast ebenso effizient wie ASCII, der pro Byte ein Schriftzeichen speichert. UTF-8 ist außerdem besonders beliebt, da es mit ASCII kompatibel ist. Die ersten 128 Zeichen in ASCII und UTF-8 werden durch dieselben Bitmuster repräsentiert und sind daher rückwärtig kompatibel. So können UTF-8-Dokumente auch rudimentär in ASCII dargestellt werden. Nicht vorhandenen Zeichencodes aus UTF-8 werden in ASCII dann einfach durch Platzhalter ersetzt. ASCII und Unicode-Formen wie UTF-16 und UTF-32 sind nicht kompatibel, da teilweise Codefolgen von ASCII in diesen Codierungsformen mit anderen Schriftzeichen belegt sind. UTF-8 hat sich inzwischen dank seiner zahlreichen Vorteile gegenüber den anderen Zeichencodierungen im Internet durchgesetzt. Im Juli 2014 nutzten 81,4% aller Websites UTF-8 als Zeichenkodierungsstandard. In UTF-8 sind auch jene Piktogramme, Schriftzeichen und Symbole zu finden mit denen im Netz verstärkt  gearbeitet wird, um Emotionen auszudrücken und Aufmerksamkeit auf einen Inhalt zu lenken:

dingbats

Wann funktionieren die Dingbats?

Dingbats, Symbole und Schriftzeichen funktionieren in Abhängigkeit von den verwendeten Fonts auf einer Internetseite und der Form der Codierung (meist UTF-8). Wird das Zeichen in dem Website-Font nicht gefunden, durchsuchen moderne Browser die Systemfonts nach der fehlenden Glyphe und setzen Sie an der entsprechenden Stelle ein (Ausnahme: Microsoft IE). Wird kein passender Ersatz für das Symbol gefunden, wird an dessen Stelle einfach ein leeres Kästchen, ein Kästchen mit einem Fragezeichen oder ein Kästchen mit dem Code des fehlenden Zeichens eingeblendet. Es gibt eine Palette an Dingbats und Schriftzeichen, die in leichter Varianz  in mindestens einem Systemfont vorkommen und daher auch eingesetzt werden können, wenn das entsprechende Zeichen in den eigenen Fonts nicht vorhanden ist. Es gibt aber auch eine ganze Reihe von Dingbats, Symbolen und Schriftzeichen, für die der Browser keinen passenden Ersatz in den Systemfonts findet und die daher nicht angezeigt werden, wenn das Zeichen in den eigenen, innerhalb der Webseite eingebundenen Fonts ebenfalls nicht vorhanden ist. In dem Fall wird auf Fehlerzeichen, wie bspw. die Kästchen zurückgegriffen. In einigen Browsern wird auch diese Variante gewählt, obwohl die Zeichen in den Systemfonts zu finden sind (IE 8). Der Font, in dem die meisten Symbole und Dingbats zu finden sind, ist die Universalia. Durch Einbindung dieser auf einer Website können die meisten der Piktogramme dargestellt werden. Aber Vorsicht: Auf der Suchergebnisseite von Google,  werden Ausschnitte aus der Website in einem anderen Font (Arial) dargestellt, der die Dingbats unter Umständen nicht enthält, womit die Zeichen nicht oder nur falsch angezeigt werden.

Und was hat das jetzt mit Suchmaschinenoptimierung zu tun?

Das Thema Dingbats ist für die Suchmaschinenoptimierung nur bedingt interessant. Ein inflationärer Gebrauch dieser Symbole hat besonders in der Vergangenheit zu einer Abwertung von Websites geführt, da Google die massive Verwendung von Dingbats als Spam-Verhalten interpretiert. Dennoch kann der bewusste und maßvolle Einsatz von Piktogrammen zu einer Verbesserung der Klickrate aus den Suchergebnissen auf eine Website führen. In den Google-Suchergebnissen ist positiv auffallen erstes Gebot. Daher kann es neben gut gewählten Titles und Descriptions zielführend sein an der einen oder anderen Stelle ein passendes Piktogramm einzubinden. Wohl gemerkt: Alles in Maßen! Zu viele Dingbats können auch zu einer Verschlechterung des Rankings führen. Bei dem Einsatz von Dingbats in Titles und Descriptions muss besonders auch folgendes gesagt werden: Nicht jedes Symbol wird auf der SERP dargestellt, besonders wenn das Symbol nicht in den Systemfonts enthalten ist. Zudem werden in den Title der Suchergebnisse nur Symbole übernommen, die über eine HTML-Entity (siehe beigefügte Liste) verfügen. Das ist nur für sehr wenige Dingbats der Fall. In der Description ist der gemäßigte Einsatz von Dingbats durchaus eine gute Idee, um Nutzer auf sich oder bestimmte Aktionen aufmerksam zu machen. Diese Technik wird von verschiedenen Websites verwendet:

congstar-dingbats-häckchen

Letztlich bleibt die Frage welche Dingbats gefahrlos verwendet werden können und dann auch in der Description der Suchergebnisse erscheinen. Die Dingbats, die einem am häufigsten begegnen sind Häkchen, Telefone, Briefumschläge und Herzen. Aber es gibt auch noch eine Reihe weiterer Symbole, die verwendet werden können, wie man hier sieht:

dingbats-in-description

Eine konkrete Aussage darüber zu machen, welche Dingbats noch in die Descriptions übernommen werden, ist nicht einfach, da es keine offizielle Liste von Google gibt. Trotzdem kann man in Eigenrecherche schon einiges herausfinden. Wir haben uns die Mühe gemacht eine Liste mit den Dingbats zu erstellen, die in den Google Descriptions und sogar teilweise in den Titles (bisher noch) angezeigt werden*. Eingebunden wird ein Dingbat über die HTML-Entity oder den numerischen Wert.

Liste der Dingbats

Natürlich kann man solche Aussagen nur unter Vorbehalt treffen, da Google immer wieder unvorhersehbar auf den Einsatz solcher Icons reagiert. *Wir erheben keinen Anspruch auf Richtigkeit oder Vollständigkeit der Daten.