SPOC-Web Icon, semantic Knowledge Management

Individuen: Dinge, Eigenschaften und Verbindungen

Unicode Zeichensätze

Dieser Abschnitt beschreibt die Eigenschaften verschiedener Zeichensätze ('Fonts') und schlägt einige open Source Fonts für die optimale Darstellung der meisten Unicode Zeichen vor.

Font Characteristiken: Größe, Gewicht, Steigung, Familie und Breite

  • Die Font Größe kann inzwischen kontinuierlich variiert werden, auch in gebrochenen Schritten.
  • Gewichte gibt es oft nur in zwei Arten: 'fett' und 'normal', wird in CSS zwischen 0 und 1000 angegeben
  • Steigung gibt es i.d.R. auch nur zwei: 'kursiv' ('italic') und 'normal' 
  • Bei Font-Breiten unterscheidet man zwischen proportionalen Fonts und solchen mit fester Breite ('monospace')
  • Die obersten generischen Font-Familien im Web-Design sind: "serif", "sans-serif", "cursive", "fantasy" und "monospace"

Monospace Fonts für die Programming

Weil in monospace Fonts die Zeichen stets die gleiche Breite haben, werden sie typically in der Programming oder für tabellarische Darstellungen verwendet. Auch für Text-basierte Benutzer-Interfaces (TUIs, z.B. DOS oder Terminal-Programme) ist dies notwendig, um Rahmen, Fenster und Grafiken ausrichten zu können. 

Unglücklicherweise gibt es nur wenige Fonts in denen die Zeichen exakt dieselbe Breite über den gesamten Unicode Bereich haben. Eine lobenswerte Ausnahme ist das Open-Source DejaVu Font Set. Es vereinigt drei Font-Familien: Serif, Sans und Monospace und hat für jede eine 'condensed' und eine 'light' Variante. Wir empfehlen sehr, diesen Zeichensatz zu installieren und im Spoc-Text Editor zu verwenden.

Ein Font mit Serifen für das Lesevergnügen

Fonts mit Serifen werden in der Regel beim Lesen als angenehmer empfunden, aber nur wenn das Medium eine hohe Auflösung besitzt. Auf Bildschirmen mit nur wenigen hundert Pixeln ist es besser, Arial oder andere Sans-Serif Zeichensätze zu verwenden.

Ein Font ohne Serifen um die Überschriften von den Texten abzugrenzen

Um Überschriften deutlicher von den Artikeln abzusetzen, werden beide typischerweise aus unterschiedlichen Familien (meist mit und ohne Serifen) gewählt.

Ein Font mit den neuesten Unicode Zeichen

Eingebaute Betriebssystem-Fonts sind oft recht unvollständig und hängen meist mehrere Jahre hinter dem aktuellen Unicode Standard zurück.

Es gibt eine obere Grenze von 65535 (2^16) Zeichen für OpenType Font Dateien, aber diese wird selten erreicht (außer bei einem Debug Font von Microsoft das für jedes Zeichen den Zahlenwert ausgibt). Einer der vollständigsten Zeichensätze von Microsoft ist 'Arial Unicode MS' mit 38,917 Zeichen (siehe en.wikipedia.org/wiki/Unicode_font/). Code2000 von James Kass hat praktisch alle (mehr als 60.000) Zeichen der sog. 'Basic Multilingual Plane', wird aber nicht mehr aktiv gepflegt. Michael Everson, einer der Co-Autoren des Unicode Standard, veröffentlicht einen Monospace Font mit recht breiter Abdeckung (9500 Characters) auf http://www.evertype.com/emono/.

Ein Beispiel für einen sehr aktuellen und vollständigen Font ist der Symbola Font von George Douros, der ebenfalls mehr als 7100 Zeichen enthält, viele in historischen Schriften (Akkadisch etc.). Ein weiterer sehr umfangreicher  (11,053 Zeichen) Serif Font ist Quivira, gepflegt von Alexander Lange.

NoTo Fonts wurden von Google im Rahmen ihrer 'Design Initiative' als Open-Source veröffentlicht. Unglücklicherweise haben sie, anders als DejaVu nur proportionale Fonts: Serif and Sans.

Hilfsmittel für den Umgang mit Unicode Zeichen

http://shapecatcher.com/ erlaubt die Suche nach dem passenden Unicode Zeichen auf eine sehr intuitive Art: Man versucht es auf dem Bildschirm zu zeichnen und liefert eine Liste der am besten passenden Unicode Zeichen. Ähnlich funktioniert http://www.martin-thoma.de/write-math/classify/ mit dem man mathematische Symbole in Unicode Zeichen oder LaTeX Codes umwandeln kann.

Alternativel kamm man Unicode Zeichen auch nach (englischen) Schlagwörtern suchen auf http://unicode-search.net/