Wir haben die 9. FAV-Konferenz hybrid gestaltet, d. h. wir hatten Besucher:innen vor Ort und am Zoom-Live-Stream. Dieser längere Beitrag ist von Jan Fischbach (FAV und Common Sense Team GmbH) verfasst. Er soll unser Setup festhalten, damit unsere Leser:innen für eigene Konferenzen davon profitieren können.
Hybrid ist mehr als das Organisieren der Videokonferenz
Warum hybrid? Inzwischen sind Videokonferenzlösungen, die nötige Bandbreite und die Kompetenz ausreichend verbreitet. Eine hybride Konferenz erlaubt Leuten das Vortragen und die Teilnahme, die nicht reisen können.
Grundsätzlich war unser Setup so: wir haben aus zwei Räumen vor Ort Bild und Ton per Zoom übertragen. In einem dritten Zoom-Raum wurden nur die Online-Vorträge übertragen. Die Besucher:innen vor Ort hatten die Auswahl zwischen 4 Vorträgen; die Besucher:innen zu Hause könnten zwischen 3 Angeboten wählen. Es wird gern vergessen, dass wir für die reinen Online-Vorträge auch einen eigenen Raum vor Ort brauchen, in dem jemand sitzt und organisiert.
Das Schauen auf ein statisches Bild ist etwas langweilig und auf Dauer ermüdend. Einerseits können wir vom Fernsehen lernen: mit mehreren Kameras kann man das Geschehen aus unterschiedlichen Perspektiven zeigen. Zum anderen ist es immer wieder interessant, die Zuschauer im Chat anzusprechen oder deren Fragen auch in den Raum vor Ort zu bringen.
Wie haben wir Bild und Ton eingefangen?
Um das Geschehen interessant und abwechslungsreich zu gestalten, haben wir mehrere Kameras aufgebaut:
- Eine Kamera zeigt auf die Bühne. Wir haben eine Obsbot Tiny benutzt. Die kann per Gestensteuerung dazu gebracht werden, dem Sprecher zu folgen. Zudem gibt es eine Software, mit der man die Kamera manuell steuern kann.
- Eine zweite Kamera zeigt ins Publikum. Das kann eine weitere Obsbot Tiny sein oder einfach ein Smartphone, auf dem eine NDI-Kamera-Software läuft (z. B. NDI HX Camera oder Camera for OBS Studio).
- Eine dritte Kamera kann an beliebiger Stelle positioniert werden. Viele System- oder Action-Kameras lassen sich per USB-Kabel zu einer Webcam umfunktionieren.
- Eine weitere Bildquelle ist der Präsentationsrechner, auf dem die Präsentation des Vortragenden läuft.
Für den Ton des Vortragenden konnten wir am Veranstaltungsort auf die vorhandene Technik mit Mischpult und Mikrofonen zurückgreifen.

Alle Quellen wurden in einem PC zusammengeführt, auf der die Software OBS läuft. Streaming per OBS ist ehrlich gesagt keine Profilösung. Profis nehmen dedizierte Hardware und schalten dort um (z. B. mit einem Atem Mini). Aber für unseren Zweck (und unser Budget) haben wir uns mit OBS begnügt.
Wir hatten an unserem Veranstaltungsort übrigens kein Problem mit dem Licht. Die Vortragenden und der Saal waren gut ausgeleuchtet. Es gibt Orte, da braucht man zusätzlich Licht.
Wie wurden Bild und Ton übertragen?
In der Schemazeichnung (Abb. 1) wird nicht deutlich, dass es noch ein paar praktische Probleme zu lösen gibt:
- Schwierigkeit 1: Es ist immer wieder aufwändig, den Ton zu verarbeiten. Hier sollte man NICHT den Mikrofoneingang des PCs verwenden. Besser ist ein eigenes Audio-Interface (z. B von M-Audio, Behringer oder Focusrite). Die Audiointerfaces nehmen analoge Audiosignale per XLR oder großer Klinge auf und geben sie digital per USB aus. (Manchmal tut es zur Not auch eine USB-Soundkarte.)
- Schwierigkeit 2: Der PC hat nicht genug USB-Anschlüsse, um alle Signale aufzunehmen. Man braucht also einen USB-Hub, der die Signale nicht stört und genug Energie liefert (also eine eigene Stromversorgung hat). Die kritischen Bild- und Tonsignale am besten direkt am Rechner anschließen. Die Maus macht am Hub meist keine Probleme.
- Schwierigkeit 3: Wer hat sich das Kamerasignal reserviert? Eigentlich lassen sich alle Quellen sehr schön in OBS einbinden. Aber häufig kommt kein Bild an. Dann geht die Fehlersuche los. Gibt es überhaupt ein Signal? Ist das Kabel kaputt? Ist der USB-Hub das Problem? Oft gibt es andere Programme, die die Kamera reservieren (Teams oder Zoom). Dann hat OBS kein Zugriff darauf. Selbst wenn Teams nicht gestartet ist, kann es die Kamera blocken.
- Schwierigkeit 4: Haben wir genug Strom am Regieplatz? Alle Geräte brauchen Strom. Einige USB-Geräte bekommen Strom von einem USB-Netzteil. Haben wir genug davon?

Wenn alle Signale da sind, können wir sie in OBS verarbeiten. (Nochmal der Hinweis, dass Profis sich andere Hardware dahin stellen würden. Das kostet auch mehr Geld.)
Wie bekommen wir die Bild- und Tonsignale zu Zoom (oder zu einer anderen Software)? Dafür gibt es die NDI-Tools, die nach der Installation eine neue Kamera und ein neues Mikrofon in Zoom darstellen.
Welche Szenen haben wir in OBS angelegt?
OBS (Open Broadcaster Studio) ist ein tolles Prgramm. In OBS werden Szenen definiert, in die verschiedene Elemente wie Kameras, Ton, Texte oder Bilder eingefügt werden. Wir haben für die Konferenz folgende Szenen angelegt:
- Warteszene mit Countdown: ein schönes Bild im Hintergrund. Im Vordergrund läuft ein Text, der die Zeit bis zur nächsten Session herunterzählt. OBS selbst kann keine Countdowns. Man braucht dafür eigene Programme wie Snaz oder My Stream Timer, die einen Text in eine Datei ausgeben, die von OBS eingelesen wird.
- Warteszene mit Uhr: wieder ein schönes Bild im Hintergrund mit einer Analoguhr im Vordergrund:
- Nur Bühne: Dies zeigt die Kamera, die auf die Sprecher:innen gerichtet ist.
- Nur Folien: Hier sieht man nur die Folien vom Präsentationsrechner.
- Bühne und Folien: Im Hintergrund wird ein neutrales Bild eingebunden. Im Vordergrund sieht man groß die Bühne und in der Ecke die Folien.
- Folie und Bühne: Nun werden die Folien groß angezeigt und die Bühne ist klein in der Ecke zu sehen.
- Bühne und Publikum: Hier sehen zwei Bilder von der Bühne und vom Publikum nebeneinander.
- Nur Publikum: Hier sehen wir nur den Saal mit dem Publikum.
In allen Live-Szenen müssen wir auch die Tonquellen einbinden, die zu hören sein sollen.
Wenn Kameras in OBS ausfallen, ist es am einfachsten, sie zu löschen und neu einzubinden. Um nicht alle Szenen überarbeiten zu müssen, ist es einfacher, alle Kameras in eine eigene Szene zu packen und diese Szene woanders einzubinden. So kann man schnell Bild- und Tonquellen reparieren.
Wie wechseln wir die Szenen?
Der Szenenwechsel macht es für die Zuschauer:innen an den Bildschirmen interessant. Schauen Sie sich einmal eine Dokumentation oder einen Film an. Zählen Sie die Sekunden bis zum nächsten Szene. Meist sind es nur wenige Sekunden.
Vor einem Vortrag zeigen wir die Warteszenen. Es wird der Countdown eingeschaltet. Alle paar Sekunden wechseln wir zwischen Countdown und Uhrszene.


Während eines Vortrags lohnt sich folgende Reihenfolge:
- Nur Bühne: So sehen wir, wer spricht.
- Nur Folien: Wir sehen die erste Folie und den Titel des Vortrags.
- Bühne und Folien: Wir sehen die Vortragenden und erkennen noch die letzte Folie. Wenn eine neue Folie angezeigt wird, zeigen wir die nächste Szene.
- Folie und Bühne: Wir sehen die Folie größer und können erkennen, was darauf steht. Wir sehen auch die Vortragenden, die vielleicht auf die Folie zeigen.
- Nur Folie: Wenn die Zuschauer:innen die Folie mitlesen sollen, zeigen wir sie ganz an.
Wenn es Reaktionen im Publikum gibt, wechseln wir zur Szene „Nur Publikum“ oder „Bühne und Publikum“.
Menschen, die das häufiger machen, kaufen sich ein echtes oder virtuelles Streamdeck. Das ist eine Hardware oder eine Software, auf der man schnell umschalten kann. Bekannt sind die Streamdecks von Elgato oder OBSwitcher für iOS.

OBS kann übrigens auch aufzeichnen und das Video vom Vortrag lokal speichern.
Wie verbinden wir die Menschen vor Ort und an den Bildschirmen?
Die Menschen vor Ort, besonders die Vortragenden vergessen meist, dass es da noch 30 Leute online gibt. Was kann man tun?
- Alle Vortragenden werden noch einmal explizit darauf hingewiesen. Es ist auch wichtig zu zeigen, was die Kamera sieht und wie das Mikrofon zu halten ist.
- Die Vortragenden können ab un dzu direkt in die Kamera blicken und die Leute online ansprechen, mindestens am Anfang begrüßen und am Ende für die Aufmerksamkeit danken.
- Zu jeder Übung, die vor Ort gemacht wird, sollte es eine digitale Variante auf einem Miro-Board o. ä. geben. Für die Organisatoren ist es nicht immer möglich, auch online Kleingruppen zu bilden. Dafür müssen eigene Breakout-Sessions angelegt werden.
- Die Veranstalter können die Online-Teilnehmer:innen aktiv auffordern, Fragen an die Vortragenden in den Chat zu schreiben: „Im Chat gibt es die Frage …„
- Die Veranstalter können im Chat das Geschehen vor Ort beschreiben und vorstellen, was als nächstes passiert.
Was ist bei der Organisation zu beachten?
Das hybride Format macht die Organisation im Vorfeld etwas aufwändiger:
- Es ist zu klären, wer wo vorträgt: vor Ort ohne Streaming, vor Ort mit Streaming, nur Streaming. Die Vortragenden sollten entsprechend informiert werden.
- Die Vortragenden sollten sich vorab überlegen, wie sie die Videokonferenzteilnehmer:innen ansprechen und einbinden.
- Wir brauchen genug Zoom-Sessions. Unsere Erfahrung ist, dass wir auch für die Räume, in denen eigentlich nicht übertragen wird, eine Zoom-Session oder einen Zoom-Gruppenraum anlegen müssen. Die Vortragenden oder Co-Speaker wissen vielleicht nicht mehr, ob das in ihrem Raum geht oder nicht. Vielleicht wollen sie auch Co-Speaker online dazuschalten.
- Folien sind online oft schlecht lesbar. Die Vortragenden sind vorher darauf hinzuweisen: wenig Text, gut erkennbare Bilder.
- Vorher ausreichend Zeit für den Aufbau und das Testen nehmen.
Einige Veranstaltungsorte arbeiten mit Techniker:innen zusammen, die das Streaming komplett übernehmen. Das kostet (Stand Juni 2022) ein paar Tausend Euro pro Tag. Das hört sich erst einmal viel an. Aber wenn man sich den Aufwand ansieht, ist es nicht zu teuer:
- Die Profis bauen bruchsichere Lösungen auf. Falls ein Gerät ausfällt, können andere Geräte einspringen. Die verteilen dann Präsentieren, Videozusammenstellung und Videokonferenz auf drei Rechner; jeder mit nur einer Aufgabe.
- Die Profis bringen eine gute Ausrüstung mit. Nicht nur die Hardware, sondern auch die Kabel und Ersatzgeräte kosten Geld. Mieten/Ausleihen ist günstiger als sich ein Kabel für 60 EUR zu kaufen, dass man nur einmal im Jahr braucht.
- Die Profis besetzen jede Position mit einer Person, z. B. eine Person für den Ton, eine Person nur für die Bildregie und eine Person nur für Zoom.
Kosten und Aufwand müssen im Verhältnis stehen. Bei einer kleinen Communitykonferenz hat man sicher Verständnis, wenn mal etwas nicht geht. Bei großen Businesskonferenzen, für die auch viel Eintritt bezahlt wird, ist das nicht zu entschuldigen.
Am Ende sollten aber nicht die Technik und die Spezialeffekte sondern die Interaktionen zwischen Veranstaltern, Vortragenden und Publikum vor Ort und am Bildschirm im Vordergrund stehen. Die Technik macht es einigen Leuten möglich, überhaupt etwas mitzubekommen. Und die Technik macht es abwechslungsreich. Aber sie ist nur Mittel zum Zweck, um die Botschaft der Konferenz zu transportieren. Die Betreuung und Ansprache im Chat ist genauso wichtig, wie guter Ton und ein gutes Bild.
Kontakt für weitere Informationen: j.fischbach[ätt}commonsenseteam.de