Da Multimedia-Konferenzen via Mbone einem möglichst breiten Kreis von Anwendern zur Verfügung stehen soll, werden die folgenden Betrachtungen und Kurzbeschreibenungen auf die derzeit kostenlos erhältlichen, sowie gebräuchlichsten Tools beschränkt. Viele dieser Tools werden noch immer ständig weiterentwickelt. Die Versionen der im folgenden angeführten Tools können in 2.1 auf S. 18 nachgeschlagen werden.
Mbone-Tools können in folgende vier Klassen unterteilt werden:
Zur Nutzung von session directory tools bedarf es einer grafische Anzeige (z.B. X11, OpenWindows, MS-Windows). Die benötigten Ressourcen bzgl. Speicherbedarf, Bandbreite und Performance der benutzten Maschine sind vernachlässigbar gering.
Derzeit sind die session directory tools sdr, sd und mmcc verfügbar. Da mmcc inzwischen veraltet ist und nur noch sehr selten eingesetzt wird, werden in diesem Abschnitt nur sdr (siehe Abb. 1 auf S. 1) und sd (siehe Abb. 2 auf S. 1) untersucht.
Zur Ankündigung einer session werden folgende Parameter unbedingt benötigt:
Da sd nur die Eingabe der unbedingt notwendigen Parameter zuläßt und inzwischen veraltet ist, wird an unserer Fakultät primär das etwas flexiblere, umfangreichere Tool sdr. So erlaubt sdr z.B. die Angabe einer URL, der genutzt werden kann, um über Details einer Konferenz ausführlich via WWW zu informieren. Ebenso unterstützt dieses Tool die Vergabe separater Media Streams (d.h., eine Multicast-Adresse je Medium) für die einzelnen Medien Audio, Video, Whiteboard und Text sowie die Angabe des zu verwendenden Protokolls und Formats (siehe Tab. 1 auf S. 2). Diese separaten Media-Streams sollten benutzt werden, falls einige session Teilnehmer nicht genügend Bandbreite zur Verfügung haben, um alle media streams zu empfangen.
Ebenso ist es möglich, 3 Termine für die anzukündigende session einzutragen, die jeweils auch von periodischer Natur sein können. Dazu werden Angaben über Zeitraum, Datum, Uhrzeit, Dauer und Wiederholungszeitraum benötigt, wobei Zeitraum und Wiederholungszeitraum folgende Werte annehmen kann:
Als letztes wichtiges Merkmal von sdr sei hier die Möglichkeit der Angabe von detaillierten Informationen zur Kontaktierung der Person (e-mail, Telefon/Fax), welche eine session angekündigt hat genannt. Gerade für die Administratoren des Mbone kann es beim Auftreten von Problemen sehr wichtig sein, diese Informationen sofort parat zu haben.
All die oben genannten Eigenschaften und Besonderheiten geben Anlaß , auch weiterhin sdr als `das' session directory tool zu betrachten und dies als primäres oder besser "Standard-``Konferenz-Management-Tool zu nutzen. An dieser Stelle muß jedoch darauf hingewiesen werden, daß aufgrund von Koordinationsfehlern oftmals die Ankündigungen von sdr nicht im sd und vice versa erscheinen. Deshalb sollte eine sdr-Ankündigungen immer mit sd kontrolliert werden, und falls diese nach 2 Tagen noch immer nicht erscheint, sollte die entsprechende Konferenz noch einmal mit sd und den gleichen Parametern der sdr-Ankündigung angekündigt werden.
Eine dritte optionale Form der Ankündigung einer multicast session ist der Eintrag dieser in das Mbone global Agenda (http://www.cilea.it/MBone/agenda.html), welcher aufgrund der Netiquette und des besseren Überblicks (Ankündigungen sind dort nach Jahr, Monat, Tag gestaffelt) jeder nutzen sollte.
Wird das session directory tool gestartet, liest es seine Konfigurations- und Cachedateien ein und öffnet ein Fenster, in welchem bereits bekannte Sessions und Steuerelemente angezeigt werden (siehe Abb. 1 auf S. 1 und Abb. 2 auf S. 1). Von hier aus können nun die einzelnen Sessions direkt gestartet werden.
Wer eine neuere Version von sdr benutzt und den Teilnehmerkreis der Konferenz kennt, kann jeden Teilnehmer sofort explizit (name@machine.domain) einladen, sodas die Teilnehmer nicht auf die Ankündigung im Session directory tool warten müssen, welche manchmal u. U. mehrere Stunden benötigt, um 'durchgestellt` zu werden. Dies ist besonders bei kurzfristig anberaumten Konferenz von Vorteil: Läuft beim einzuladenden Teilnehmer sdr, wird durch das Aktivieren einer Einladung (Invitation) ein entsprechender Dialog plus Warntöne bei dem eingeladenen Teilnehmer ausgegeben, der zur Konferenzteilnahme aufruft. Der Teilnehmer kann nun entscheiden, ob er an der Konferenz teilnehmen will oder nicht. Der Einladende erhält in jedem Fall eine Nachricht, ob der eingeladene Teilnehmer die Konferenz angenommen, abgelehnt oder keine Reaktion auf die Einladung gezeigt hat.2
2 Grundsätzlich sei noch einmal darauf hingewiesen, daß man auch ohne session directory tool eine multicast-fähige Anwendung starten und somit eine Multimedia-Konferenz abhalten kann. Wichtig ist dabei nur, daß die Teilnehmer der Konferenz wissen, welche Parameter (mind. Medium mit Multicast-Adresse und Port) verwendet werden.
Vat ist einfach zu bedienen und erlaubt die Teilnahme an mehreren Sessions gleichzeitig. Wird nicht die Option `Keep Audio` benutzt, versucht vat, die jeweils aktive Audio Session auf das eingestellte Ausgabegerät umzuleiten. Dies ist ein bedeutender Vorteil gegenüber der derzeitigen Version von rat, welche zwar mehrmals gestartet werden kann, jedoch immer nur via zuerst gestarteten rat mithören kann. Selbst wenn das zuerst gestartete rat beendet wird, sind die bereits gestarteten rats nicht in der Lage, die Audioausgabe zu übernehmen. Vat kennt diesbezüglich keine Probleme.
Audio Codecs (Kodierungs/Dekodierungsverfahren):
Nachteilig bei NeVoT ist, daß es nur eine sehr plump wirkende, benutzerunfreundliche grafische Benutzeroberfläche und keine komplexe Dialogbox zum Einstellen aller verfügbaren Optionen wie beispielsweise vat oder rat besitzt. Des weiteren ist zu bemängeln, daß viele einstellbare Optionen für Laien zu technisch und unverständlich sind und auch keine Dokumentation oder Online-Hilfen diesen Zustand beheben könnten. Angesichts dessen kommt dieses Tool nicht über den Status eines experimentellen Programms hinaus und wird somit in der Fakultät für Informatik nur zu experimentellen Zwecken eingesetzt.
Audio Codecs (Kodierungs/Dekodierungsverfahren):
Besonderheiten dieses Tools sind:
Der Intra-H.261 Kodierer kombiniert die Vorteile von nv's blockbasierten bedingten Auffüllungsschema (Robustheit bzgl. Verlust) mit denen des H.261 (höhere Kompressionsraten und Kompatibilität mit Hardware-Codecs). Für eine feste Bitrate erreicht der H.261 Kodierer ca. 2-4 mal höhere Frameraten als beim nv-Kodierungs Format.
Vic erlaubt es, Sichtfenster so zu konfigurieren, daß es dem Redner/Sprecher ``folgt''. Durch Hinweise von vat wird das Sichtfenster zum derzeitig sprechenden Konferenzteilnehmer umgeschaltet. Es können mehrere fenster auf diese Art und Weise konfiguriert werden, so daß immer die letzten N Sprecher angezeigt werden.
Vic verfügt über verschiedene Dithering Algorithmen zur Representation von Video Streams mit kontinuierlichen Farbtönen auf sogenannten color-mapped displays. Der Nutzer kann die Laufzeitkomplexität durch die gewünschte Qualität der Darstellung beeinflussen. Ein error-diffusion dither bewirkt die höchste Qualität, aber auch die größte CPU-Last, während eine direct color quantization nur eine geringe CPU-Last bewirkt, jedoch nur Bilder von geringer Qualität generiert.
Vic besitzt ein Interface, welches ein Mischen von Grafiken mit dem aufgenommenen Video erlaubt. Sogenannte Overlays können über den ``Conference Bus'' heruntergeladen und manipuliert werden, so daß es dem ``production team'' möglich ist, ein Broadcast mit Überschriften, Anmerkungen, Logos etc. zu verbessern. Da der ``Conference Bus'' mittels tcl (tool command language) manipuliert werden kann, ist es relativ einfach, existierende oder neue Scripte Überschriften-Generierung ``on-the-fly'' zu nutzen. Ein Beispiel dafür ist das Script title-maker, welches in der vic-Distribution enthalten ist.
Video streams können simultan auf einem Workstation-Bildschirm und einem externen Video-Ausgabe-Port ausgegeben werden, vorausgesetzt daß die verwendete Hardware eine externe Ausgabe unterstützt. Dies erlaubt die Wiedergabe eines einzelnen streams als analoges Videosignal auf ein NTCS/PAL-Gerät in voller Größe und erzeugt somit ein in der Regel ein komfortableres Bild (z.B. auf einem Videoprojektor) als in einem kleinen X-Window. Ebenso kann dieses Option genutzt werden, um Videokonferenzen z.B. mittels eines Videorecorders aufzuzeichnen.
Norm | small | normal | large |
---|---|---|---|
H.261 | 176x144 (QCIF) | 352x288 (CIF) | - |
NTSC | 640x480 | 320x240 | 160x120 |
PAL | 768x576 | 384x288 | 192x144 |
Video Codecs (Kodierungs/Dekodierungsverfahren):
Video Codecs (Kodierungs/Dekodierungsverfahren):
Norm | small | medium | large |
---|---|---|---|
NTSC | 160x120 | 320x240 | 640x480 |
PAL | 192x144 | 384x288 | 768x576 |
Da in Konferenzen, Vorträgen etc. oft wichtige Informationen mittels Overheadprojektor präsentiert werden, die Videoaufnahme des projizierten Bildes aus techmischen Gründen jedoch unbefriedigend ist, kann wb in diesen Fällen genutzt werden, um die entsprechenden Informationen synchron zum Vortrag mit Postscript-Qualität zu allen Konferenzteilnehmern zu übertragen. Der Nutzer des wb hat dann auch die Möglichkeit, die gewünschten Informationen als Postscriptdatei abzuspeichern und erspart sich somit den Aufwand für die Neuerstellung entsprechender Dokumentationen bzw. die Suche oder das Herunterladen der Dokumente von einem Server. Ebenso sollte das Whiteboard benutzt werden, um Informationen bzgl. des derzeitigen Vortrages zu geben (z.B. Name, Firma des Vortragenden; Beginn, Dauer und Thema des Vortrages).
Wird eine Vorlesung, ein Seminar oder Präsentation gehalten, ist es ratsam, jede verwendete Folie schon vor dem Vortrag in eine separate Postcriptdatei zu konvertieren. Liegt eine Datei nur im Postscriptformat mit mehreren Seiten vor, kann dies in der Regel mit dem Tool pssplit oder breakps in einzelne Dateien mit je einer Seite aufgeteilt werden. Die erhaltenen Postscriptdateien können dann zur gegebenen Zeit manuell oder unter Zuhilfenahme des Programms wbimport in das wb importiert werden.
Um Bandbreite zu sparen, die Übertragung und Darstellung der Datei zu beschleunigen, empfiehlt es sich die Postscriptateien zu vereinfachen und auf kleinstmögliche Größe zu bringen. Folgende Herangehensweise hat sich bei uns im Umgang mit wb bewährt:
#!/usr/bin/sh # script distill to make postscript programs smaller, clean, # uniform and fast # by elkner@irb.cs.uni-magdeburg.de # Usage: distill file ... ... while ( [ $# -ne 0 ] ) do FILES=''$FILES ($1)distill `` shift done echo ``$FILES'' | gs /usr/localapp/Mbone/etc/still.ps
#!/usr/bin/sh # script pscompress to convert postscript files # to LZ-compressed postscript files # by elkner@irb.cs.uni-magdeburg.de # Usage: pscompress file ... ... while ( [ $# -ne 0 ] ) do mv $1 $1.tmp cat $1.tmp | lzps >$1 ls -l $1 $1.tmp shift doneIn Abhängigkeit vom Inhalt der Datei und mit welchem Programm diese erstellt wurde (Framemaker, Word, CorelDraw etc.), werden Kompressionsraten von 50% und mehr erzielt. Da wb standardmäßig auf den Import von Dateien mit einer maximalen Größe von 32 KB beschränkt ist, muß im Falle des Imports größerer Dateien wb mit dem Parameter -P n gestartet werden, wobei n das obere Limit in Bytes für eine importierbare Datei angibt.
Damit die Teilnehmer bei der Bearbeitung des Textdokumentes nicht irritiert werden, macht NTE jede Aktionen durch Symbole mit dem Namen des Editierenden für jeden sichtbar (siehe Abb. unten).
Abschließend kann gesagt werden, daß NTE sicher keine verteilte Textverarbeitung ersetzen kann, jedoch als begleitendes Hilfsmittel für multimediale Konferenzen, trotz seines derzeitigen Limits von ca. 10 KB Dokumentgröße, geeignet ist.
Abb. 9: nt
1.5 Hybrid Tools
1.5.1 INRIA Videoconferencing System
Das INRIA Videoconferencing System (IVS) ist ein Softwaresystem zur
kombinierten Übertragung von Video- und Audiodaten im Internet
mittels Uni- oder Multicast. Zur Übertragung von H.261 Video
Streams wird das RTP genutzt. Da andere, spezialisiertere Tools mehr
und teilweise auch bessere Kodierungs/Dekodierungsverfahren für
Audio/Videostreams sowie grafische Benutzeroberflächen enthalten,
wird von dem Einsatz dieses Tools abzuraten.
Audio Codecs (Kodierungs/Dekodierungsverfahren):
Video Codecs (Kodierungs/Dekodierungsverfahren):
Norm | small | normal | large |
---|---|---|---|
H.261 | 176x144 (QCIF) | 352x288 (CIF) | 704x576 (SCIF) |
Der Image Multicaster Server kann von der Kommandozeile oder von imm selbst gestartet werden.
encoding name | Description | sample/frame | bits/sample | ms/frame | clock rate (Hz) | channels |
---|---|---|---|---|---|---|
1016 | Encoding 1016 is a frame based encoding using code-excited linear prediction (CELP) and is specified in Federal Standard FED-STD 1016 (4800 bps) | frame | N/A | 30 | 8000 | 1 |
G721 | ITU-T Recommendation G.721 [G721] descri bes the algorithm recommende for conversion of a 64 KB/s A-law or u-law PCM channel to and from a 32 KB/s channel. The conversion is applied to the PCM stream using an Adap tive Differential Pulse Code Modulation (ADPCM) transcoding technique. This algo rithm will be registered with the IANA for MIME use under the name Audio/ 32KADPCM. | sample | 4 | N/A | 8000 | 1 |
G722 | G722 is specified in ITU-T recommendation G.722, ,7 kHz audio-coding within 64 kbit/s". | sample | 8 | N/A | 8000 | 1 |
G728 | G728 is specified in ITU-T recommendation G.728, ,Coding of speech at 16 kbit/s using low-delay code excited linear prediction". | frame | N/A | 2.5 | 8000 | 1 |
GSM | GSM (group speciale mobile) denotes the European GSM 06.10 provisional standard for full-rate speech transcoding, prI-ETS 300 036, which is based on RPE/LTP (residual pulse excitation/long term prediction) coding at a rate of 13 kb/s. | frame | N/A | 20 | 8000 | 1 |
DVI4 | DVI4 is specified, with pseudo-code, in [6] as the IMA ADPCM wave type. | sample | 4 | N/A | 8000 16000 | 1 |
VDVI | VDVI is a variable-rate version of DVI4, yiel ding speech bit rates of between 10 and 25 kb/ s. It is specified for single-channel operation only. | sample | var. | |||
LPC | LPC designates an experimental linear predic tive encoding contributed by Ron Frederick, Xerox PARC, which is based on an implemen tation written by Ron Zuckerman, Motorola, posted to the Usenet group comp.dsp on June 26, 1992. | frame | N/A | 20 | 8000 | 1 |
PCMA, PCMU | PCMA and PCMU are specified in CCITT/ ITU-T recommendation G.711. Audio data is encoded as eight bits per sample, after log arithmic scaling. (A-law, mu-law) | sample | 8 | N/A | 8000 | 1 |
L8 | L8 denotes linear audio data, using 8-bits of precision with an offset of 128, that is, the most negative signal is encoded as zero. | sample | 16 | N/A | 44100 | 2 |
L16 | L16 denotes uncompressed audio data, using 16-bit signed representation with 65535 equally divided steps between minimum and maximum signal level, ranging from -32768 to 32767. The value is represented in two`s com plement notation and network byte order. | sample | 16 | N/A | 44100 | 1 |
MPA | MPA denotes MPEG-I or MPEG-II audio encapsulated as elementary streams. The encoding is defined in ISO standards ISO/IEC 11172-3 and 13818-3. | frame | N/A | dep. | 32000 44100 48000 | dep. |
4siehe RFC 1890: RTP Profile for Audio and Video Conferences with Minimal Control
encoding name | Description |
---|---|
CellB | The CELL-B encoding is a proprietary encoding pro posed by Sun Microsystems. |
JPEG | The encoding is specified in ISO Standards 10918-1 and 10918-2 |
nv | The encoding is implemented in the program ,nv`, version 4, developed at Xerox PARC by Ron Frede rick. |
H261 | The goal of the H.261 standard is to provide Audio- Visual Services over the Integrated Sevices Digital Network (ISDN) at rates multiple of 64 Kbits/sec. For videophone applications the target rate is typically 64 or 128 Kbits/sec; for videoconferencing it is in the range of 384 Kbits/sec or more. |
MPV | MPV designates the use MPEG-I and MPEG-II video encoding elementary streams as specified in ISO Standards ISO/IEC 11172 and 13818-2, respectively |
MP2T | MP2T designates the use of MPEG-II transport streams, for either audio or video |