Zum grundtheorem der informationstheorie, insbesondere in der optik

17
Wolter, Hans Physica XXIV 1958 Zernike issue 457-475 ZUM GRUNDTHEOREM DER INFORMATIONSTHEORIE, INSBESONDERE IN DER OPTIK.*) von HANS WOLTER Institut ffir angewandte Physik, Universit~t Marburg, Deutschland Zusammenfassung Wie an der Minimumstrahlkennzeichnung experimentell gezeigt wird, ist das Grundtheorem der Informationstheorie (Expansion-Sampling-Theorem) nicht streng und allgemeingiiltig. Die absoluten prinzipiellen MeBfehlergrenzen sind vielmehr allein dutch Heisenbergs Unsch~rfebedingungen des Elementarprozesses diktiert. Es wird gezeigt, dass auch die Anwendung einer Reihe schon bekannter Methoden tiquiva- lent einer Unterschreitung der vom Sampling-Theorem postulierten MeBgenauigkeits- grenzen ist. Die Diskrepanz in dem geltLufigen Beweis des Sampling-Theorems wird aufgewiesen. Die informationstheoretischen Grundtheoreme, das Expansion-Theorem, speziell auch die Abbesche Aufl6sungsbeziehung in der Optik und die Kfipfmfillerbeziehung in der Nachrichtentechnik beschrAnken an sich noeh nicht die prinzipiellen Informations- m6glichkeiten. Eine solche BeschrXnkung wird nur vonder Endlichkeit der Energie- quanten (Anzahl N) gemttB /3x . Aax/). ~ 1/ v'N oder yon St6rungen oder vonder ,,Strahlungskopplung" bewirkt. Es werden Mal3- nahmen (Minimumstrahlkennzeichnung bzw. Objektfeldbeeinflussung) diskutiert, mit deren Hilfe die Aufl6sung tiber die durch das Expansion Theorem bezeichneten Grenzen hinaus verbessert werden kann. Die Grundtheoreme k6nnen konsequent nur als Aussagen fiber die Gr6ssenverh~tlt- nisse yon Reihen-Entwicklungskoeffizienten zueinander angesehen werden. Das Integral (l/22) fdx dy d(sin ~x) d(sin ~v) gibt die Anzahl derjenigen ,,Koeffizienten", die gross gegenfiber dem Rest der Koeffizienten sind; aber dieser Rest ist nicht unbedeutend, er kann durch geeignete MaBnahmen zur Wirkung gebracht und zur Information ausgenutzt werden. 1. Anlass ]iir die Untersuchung. Unter den Grundlagen der Informations- theorie in der Optik und in der Nachrichtentechnik spielen das Expansion- Theorem 1) t~nd das analoge Sampling-Theorem 2) die ffihrende Rolle. Seit die Minimumstrahlkennzeichnung 3) Wege zur Genauigkeitssteigerung op- fischer Messungen zeigte, schien der Verdacht berechtigt, dass den in- formationstheoretischen Grundtheoremen nicht die ihnen zugesprochene *) Vorgetragen in Saarbrficken am 15.11.1957. -- 457 -- Phy~ ica XXIV

Transcript of Zum grundtheorem der informationstheorie, insbesondere in der optik

Wolter, Hans Physica XXIV 1958 Zernike issue

457-475

Z U M G R U N D T H E O R E M D E R I N F O R M A T I O N S T H E O R I E , I N S B E S O N D E R E I N D E R O P T I K . * )

von HANS WOLTER

Institut ffir angewandte Physik, Universit~t Marburg, Deutschland

Z u s a m m e n f a s s u n g

Wie an der Minimumstrahlkennzeichnung experimentell gezeigt wird, ist das Grundtheorem der Informationstheorie (Expansion-Sampling-Theorem) nicht streng und allgemeingiiltig. Die absoluten prinzipiellen MeBfehlergrenzen sind vielmehr allein dutch Heisenbergs Unsch~rfebedingungen des Elementarprozesses diktiert. Es wird gezeigt, dass auch die Anwendung einer Reihe schon bekannter Methoden tiquiva- lent einer Unterschreitung der vom Sampling-Theorem postulierten MeBgenauigkeits- grenzen ist. Die Diskrepanz in dem geltLufigen Beweis des Sampling-Theorems wird aufgewiesen.

Die informationstheoretischen Grundtheoreme, das Expansion-Theorem, speziell auch die Abbesche Aufl6sungsbeziehung in der Optik und die Kfipfmfillerbeziehung in der Nachrichtentechnik beschrAnken an sich noeh nicht die prinzipiellen Informations- m6glichkeiten. Eine solche BeschrXnkung wird nur v o n d e r Endlichkeit der Energie- quanten (Anzahl N) gemttB

/3x . Aax / ) . ~ 1/ v ' N

oder yon St6rungen oder v o n d e r ,,Strahlungskopplung" bewirkt. Es werden Mal3- nahmen (Minimumstrahlkennzeichnung bzw. Objektfeldbeeinflussung) diskutiert, mit deren Hilfe die Aufl6sung tiber die durch das Expansion Theorem bezeichneten Grenzen hinaus verbessert werden kann.

Die Grundtheoreme k6nnen konsequent nur als Aussagen fiber die Gr6ssenverh~tlt- nisse yon Reihen-Entwicklungskoeffizienten zueinander angesehen werden. Das Integral

(l/22) f d x dy d(sin ~x) d(sin ~v)

gibt die Anzahl derjenigen ,,Koeffizienten", die gross gegenfiber dem Rest der Koeffizienten sind; aber dieser Rest ist nicht unbedeutend, er kann durch geeignete MaBnahmen zur Wirkung gebracht und zur Information ausgenutzt werden.

1. Anlass ]iir die Untersuchung. Unter den Grundlagen der Informations- theorie in der Optik und in der Nachrichtentechnik spielen das Expansion- Theorem 1) t~nd das analoge Sampling-Theorem 2) die ffihrende Rolle. Seit die Minimumstrahlkennzeichnung 3) Wege zur Genauigkeitssteigerung op- fischer Messungen zeigte, schien der Verdacht berechtigt, dass den in- formationstheoretischen Grundtheoremen nicht die ihnen zugesprochene

*) Vorgetragen in Saarbrficken am 15.11.1957.

- - 457 --

Phy~ ica XXIV

458 HANS WOLTER

Allgemeingiiltigkeit und Strenge zukomme. Die daraufhin veranlassten und jetzt durchgefiihrten Untersuchungen best/itigen mit ihren Ergebnissen diesen Verdacht. Die bier vorgelegte Ver6ffentlichung bringt eine Betrach- tung vor aUem zu der grunds~itzlich-physikalischen und zu der optischen Seite des Problemenkreises. iJber eine Untersuchung der nachrichtentech- nischen Konsequenzen wird in einer elektrotechnischen Fachzeitschrift berichtet.

Die in F. Zernikes grundiegenden Arbeiten ver6ffentlichen Gedanken haben wesentlich zur Anregung dieser Untersuchung beigetragen.

2. Das Sampling- und das Expansion-Theorem. Die in der Nachrichten- technik grundlegende K i i p f m i i l l e r - N y q u i s t - B e z i e h u n g 4) (Bandbreite ms/ Zeitaufl6sung = ½) wurde in neuerer Zeit zum Sampling-Theorem 5) priizisiert, das wie folgt gedeutet zu werden pflegt:

,,Wird eine ausserhalb der Zeit 0 ~ t ' ~ T verschwindende Zeitfunktion /(t) mit einen Nachrichtenkanal des Bandes 0 bis W Hz empfangen, so werden dabei nur 2 W T Zahlenangaben iib.ermittelt; insbesondere ist die Nachricht dutch die Funktionswerte an den ,,Samplingpoints" t = n /2W mit ganzen Zahlen n fiir 0 ~ n ~ 2 W T vollstiindig und streng bestimmt."

Das bzgl. der Dimensionen verallgemeinerte optische Analogon ist das Expansion-Theorem, dem G a b o r 1) neuerdings die eingeschr~inkte Fassung gab :

,,Assume that the object area, large compared with the square of the wavelength, is limited by a black screen. Assume also that there is a similar limitation in an aperture plane, at a great distance from the object plane (Abb. 1). Then, in the domain limited by these two black screens, there exist n independent solutions of the wave equation A2u + (2a/~)2u = 0; that is to say solutions with u = 0 immediately behind the black screen, and n is

n = ~t-~fdxdyd(sin ~)d(sin!~v) = h-~fdxdydp~dpv; (p = h/,t). (1)

Any progressive wave through the object area and through the aperture can expanded in terms of these t, eigensolutions, with not more than n complex coefficients."

Die Erfiillung der Bedingung "the great distance" sei dutch die abbil- dende Optik, in deren Brennebene die Aperturebene liegt, sichergestellt (Abb. I). Die Einschr~inkung "large compared with the square of the wave- length" trffft in die entscheidende Richtung, reicht aber nicht aus, um die Widerspriiche zu vermeiden, die in den n~ichsten Abschnitten betrachtet werden. Nicht einmal die viel schiirfere Voraussetzung n >~ I wiirde alle Schwierigkeiten aussctfliessen. Zuniichst sei jedoch der Fall n ~ 1 betrach- tet.

Nehmen wir z.B. Cartesische Koordinaten und koordinatenparallele Be-

ZUM GRUNDTHEOREM DER INFORMATIONSTHEORIE, IN DER O P T I K 4 5

grenzungen an, die den Bedingungen

/Ix./I(sin ax) = 4; /Iy./I(sin av) = / t (~

gentigen *), dann ist nach dem Expansiontheorem n = 1. Die Informatiol wird also auf die Llbermittlung einer einzigen komplexen Zahl (bier auf eine einzige Lichtamplitude) beschriinkt.

i ' x

~ Y

i i / /

Hau ,tebene des Objektivs

Objektebene

# Px

Py

/ Bird in gri~sserer Entfernung

Aperturebene

Abb . I. Z u m E x p a n s i o n - T h e o r e m .

Bei Apertur A(sin ~x) kann nach (2) in der 0ffnung Ax keine Struktm tibertragen werden, da dies ein n ~ 2 voraussetzen wiirde. Das ist di( tibliche Abbesche Aussage tiber das Aufl6sungsverm6gen des Mikrosk0ps **). Gln. (2) besagen ebenso, dass bei einem DurchlaBbereich der Brei te/Ix keinc Winkelangabe fiber die Photonenherkunft mit h6herer Genauigkeit als /I (sin ax) = ~//Ix m6glich ist.

3. Widerspri~che gegen das Expansion-Theorem. Die letzte in Teil 1 formu- lierte Form des Expansion-Theorems steht im Einklang mit den bekannten Regeln z.B. tiber die Genauigkeit einer Winkelanzeige bei Lichtzeiger- ger~iten: Bei einer Spiegelbreit e / I x ist die Winkelmessung auf / i~z m ~/Ax genau ausftihrbar, da die Beugung das Bild der fadenf6rmigen Lichtquelle entsprechend dieser Beziehung verbreitert.

Gibt man aber dem Spiegel als Aufiage eine Phasenplatte, die das Licht der einen Spi'egelhiifte um 180 ° phasenverschiebt gegentiber dem Licht der anderen H~tlfte, so wird das Lichtquellenbild yon einem feinen Minimum

*) Die 0ffnungen in der Obiektebene und in der Aperturebene kSnnen demnach gross gegen ~.2 sein. **) Ein universeller Faktor der Gr6ssenordnung 1, also auch .~; 2~; ~ auf der rechten Seite yon (2} mag undiskutiert bleiben.

460. HANS WOLTER

durchzogen, das prinzipiell beliebig genaue Winkelmessungen gestattet, sofern Streulicht ferngehalten wird und sofern man lange genug beobachten kann, um die bei endlicher Photonenanzahl auftretende statistische Schwan- kung der Photonenverteilung hinreichend klein zu halten 6) 7).

Das Expansion-Theorem gilt also ftir diese und mannigfache andere ver- ~ffentliche Anordnungen nicht. So kann man anch das Aufl6sungsverm6gen eines Spektrographen wesentlich verbessern, wenn man die 180°-Phasen - platte in den parallelen Strahlengang setzt s) 9).

Ausser der Minimumstrahlkennzeichnung widersprechen aber auch alte Erfahrungen der Astronomen 1) dem Expansion-Theorem. Man kann den Oft 6ines Sternes (Winkel der von ibm einfallenden Wellen) dutch hinrei- chend viele Aufnahmen viel genauer messen, als der Gr6sse des Beugungs- scheibchens im Bilde -- und damit der Gh (2) -- entspricht ; Ax ist dann der effektive Objektivdurchmesser. Doch ist hier die Ungenauigkeit der Einzel- aufnahme durch das Expansion-Theorem gr613enordnungsm~Big gut dar- gestellt, w~hrend die Minimumstrahlkennzeichnung schon bei einer Auf- nahme weit unter die Grenze (2) ftihrt. Auch Michetsons Interferenzmethode der Doppelsternvermessung und der Messung von Sterndurchmessern ftihrt zu h~herer Genauigkeit, als das Expansion-Theorem erwarten l~sst.

Alle soeben genannten Methoden, die Expansion-Theorem-Grenze zu unterschreiten, haben eines gemeinsam; ausser der unmittelbaren Beobach- tung wird eine a priori-Information in das Veffahren hineingesteckt. Bei den Sternortmessungen und bei Michelsons Verfahren z.B. ist es die a priori- Annahme 10) tiber die Objektform (,,Punkt" bzw. ,,Kreisscheibe"). Ahnlich liegen die Dinge bei dem Lichtzeigerverfahren, bei dem sowohl tiber den Spiegel als auch tiber den abgebildeten Lichtquellenfaden -- was nun jeweils als Objekt aufgefasst wird -- a priori-Informationen vorliegen. Zu- s~tzliche a priori-Informationen k6nnten auch zus~tzliche Aussagem~glich- keiten bedeuten. Dass jedoch nicht die a priori-Information sondern eine Abweichung vom Expansion-Theorem entscheidend ist, wird in Zi£fer 8 gezeigt.

4. Minimumstrahlkennzeichnung ohne wesentliche a priori-In/ormation. Es schien dem Veffasser wichtig, ein Vedahren zu konstruieren, bei dem eine a priori-Information offensichtlich nicht vorliegt. Ein beliebiges Schlieren- objekt wird dabei im Schattenwurf von einer punkff6rmigen Lichtquelle auf einen Schirm projiziert. Um Objektorte und durch das Schlierenobjekt bewirkte Lichtablenkungen eindeutig zu kennzeichnen, wurden zwei ge- trennte, sich mit den Mittelkanten fast beriihrende Fresnelsche Bripismen zwischen Lichtquelle und Objekt gestellt (Abb. 2), wie Verf. das auf S. 588 des Hdb. der Physik, Bd. 24 (1956) angedeutet hat. Das Schirmbild ist von gekreuzten Intefferenzstreifensystemen durchzogen, die zu jedem Objekt- ort (x;y) die zugeh6rigen Lichtablenkkomponenten ~z(x; y) und ~u(x;y) zu

ZUM GRUNDTHEOREM DER INFORMATIONSTHEORIE, IN DER OPTIK 461

messen gestatten. Die Genauigkeit ist wesentli,h grSsser, als der G1. (2) entspricht.

. I J l t I . . . . . / / i' Punktquette ', " - ~ ' - ' 1 . . . . ~ . ~ 1 [ !

' , ' , i t / I t . . . . .

• / t

~ / /6 .~ , . , , , , o I I ; • " / Biprismen / ) "/

Abb. 2. S c h a t t e n s c h l i e r e n v e r f a h r e n m i t M i n i m u m s t r a h l k e n n z e i c h n u n g .

Besonders einfach wird das Verfahren, wenn man sich auf ,,eindimensio- nale Objekte" beschr~inkt, also z.B. auf Kiivetten mit Konzentrations- schlieren nur in-x-Richtung. In y-Richtung liege kein Brechungsindex- gradient vor. Dann geniigt ein einzelnes Biprisma, dessen Mittelkante unter 45 ° zur x-Achse gestellt wird. Das Verfahren entspricht dem Wienerschen Schlierenverfahren; nur an die Stelle des Drahtes oder Spaltes ist das Bi- prisma getreten, und die Ablenkkurve ex(x) wird nicht von dem durch Beugung unscharfen Drahtschatten oder dem ,,Spaltbild" auf dem Schirm markiert sondern von den ungehindert scharfen Interferenzminima (Abb. 3). Die Ablesegenauigkeit ftir Koordinate x und Ablenkung e~ entspricht einer zu (2) analogen Unsch~.rfebedingung

~ x . ~ = ,t/g (3)

mit einem Gewinnfaktor g m 300. 11) Die Abb. 3 zeigt neben den nahezu diagonalen Minimumkurven des Mini-

mumschlierenverfahrens die Aufnahme des entsprechenden Maximum- verfahren links oben, bei dem ein Spalt als Kennzeichnungsmittel des Wie- nerschen Verfahrens diente und eine Konzentrationsschliere mit nut einem Gradientenmaximum vorlag. Rechts unten ist die nach Philpot-Svensson aufgenommene ~x(x)-Kurve in das Bild eingefiigt worden. Die Mel3genauig- keit wird durch die Sch~rfe der drei Kurvenarten veranschaulicht.

Zweierlei ware einzuwenden. Erstens macht dieses gegenfiber Abb. 1 ver- einfachte Verfahren wieder yon einer a priori-Information Gebrauch; denn ~v --= 0 wird vorausgesetzt. Aber nach der Beugungstheorie und nach Hei-

464 HANS WOLTER

und bei einer Minimumkennzeichnung

S(Nmin) AZmin = [(d/dz)Oogi(z))]mi n (9)

so ist der relative Gewinn

groin Azmax S(Nmax) [(d/dz)(log I(z))]min g~el . . . . . (10)

gmax Azmin S(Nmin) [(d/dz)(log I(z)] max

Die beiden Aufnahmen sind so zu belichten, dass die zur Kennzeichnung dienenden Flanken im Graubereich optimal liegen. Dann ist Nmax gleich N m t n an den beiden benutzten Stellen; also ist der erste Faktor in G1. (10) rechts gleich 1.

Es kommt also zur Erzielung eines hohen Genauigkeitsgewinnes darauf an, die logarithmische Ableitung, d.h. die relative Flankensteilheit, gross zu machen. Gerade das bewirkt die Minimumstrahlkennzeichnung optimal, wie frfiher gezeigt wurde. 12). Dort wurde der Feldst~rkebetrag zur Beurteilung herangezogen; da bei iE(z)i2 = I(z) auch log f(z) = 2 log IE(z)l ist, folgt

groin [(d/dz) (log [E(z)l)]min g r e l = - - -- (11)

gmax [(d/dz) (log IE(z)[)]max

l o o ' t , ~

'°'I /[ 1 g / t I , u . ,

1El b

10.1.

T IE I c

1 0 * le 100 *1, •

100 */,L ~ e 1

K o o r d i n a t e z .

Abb. 4. Theoretische ,,Richtdiagramme" der Strahlkennzeichnung, a) mit 180 °- Phasenplatte (Minimumstrahlkennzeichnung), b) Schirmkante, c) Spalt optimaler Breite, d) Spalt yon 40% der optimalen Breite, e) Spalt yon 166% der optimalen Breite. Die Achse ist logarithmisch geteilt. Die Steilheit der Kurven gibt unmittelbar

d/dz (log ]E(z)l ).

Man vergleiche die hohen Flankensteilheiten des log IE(z)[ der Minimum- strahlkennzeichnung mit den geringen bei der Maximumstrahlkennzeich- nung in Abb. 4. Entscheidend ist, dass die statistische Korn- bzw. Photonen-

ZUM GRUNDTHEOREM DER INFORMATIONSTHEORIE, IN DER OPTIK 465

schwankung stets auf die logarithmische Ableitung als Charakteristikum der Kennzeichnungsgenauigkeit ftihrt. Die logarithmische Ableitung kann durch Minimumstrahlkennzeichnung beliebig gesteigert werden, wenn Streu- licht fehlt und hinreichend lange belichtet werden kann.

6. Absolute Me~genauigkeitsgrenzen bei beliebiger Kennzeichnung. Nach Gaul3 steigert sich bei m-facher Messung die Mel3genauigkeit um den Faktor ~/n~. M i t m Aufnahmen kann man die statistische Photonen- bzw. Korn- schwankung so herabsetzen, class man einen Gewinn gra -~" %/m gegeniiber einer einzigen Aufnahme erzielt.

Da das Minimumschlierenverfahren einen Gewinn g = 300 gegentiber dem Maximumverfahren erreichte, braucht man g2 = 90000 Aufnahmen des Maximumverfahrens, um dieselbe Genauigkeit wie bei der einen Aufnahme des Minimumverfahrens zu erhalten. Um eine Minimumaufnahme gut aus- zuwerten, braucht man 14 Tage, fiir eine Maximumaufnahme, die etwas weniger Sorgfalt erfgrclert, 4 Tage. 90 000 Maximumaufnahmen benStigen eine Auswertezeit von 360 000 Tagen = 1000 Jahren.

Das zeigt den praktischen Vorteil der Minimumstrahlkennzeichnung; doch sind beide Verfahren in anderer Hinsicht einander ~iquivalent. Die Gesamtbelichtungszeit aller 90 000 Maximumaufnahmen ist 90 sec, und die Belichtungszeit der einen Minimumaufnahme betr~igt ebenfalls 90 sec, wenn alle sonst mal3gebenden Bemessungen die gleichen sind.

Diese Gesetzm~il3igkeit des Photonenbedarfs ist ganz aUgemeingiiltig; der Nachweis ist implizit in der zitierten Arbeit erbracht, und zwar mit den Gleichungen (47), (51), (52), die etwa besagen

gl/g2 - ~ "v/-T1/'V/T2 (12)

wenn g~ die Gewinnfaktoren und Tk die Belichtungszeiten zweier zu ver- gleichender Verfahren bezeichnen.

Der Vollst~indigkeit halber sei das hier auch an einer einfachen Uberle- gung, die das Streulicht beriicksichtigt, gezeigt. Wir betrachten eine Licht- verteilung

I(z) -- sin I z + Is, (13)

in der Is inkoh~irentes Streulicht sei, das in dem kleinen zur Kennzeichnung benutzten Bereich konstant sei. Es ist

d d sin z . cos z - ~ (log IE(z)[) =: -1, !l,. ~ (sin e z + I8)) = (14)

" d sin 2 z + I ,

Bei einer Maximumkennzeichnung legt man den Graubereich an die Stelle sin~ z ---- ½, die Stelle der Halbwertsbreite ! Dort ist sinz = cos z und wegen Is ~ 1 folgt

[(d/dz) (log IE(z) l)]max = 1. (lS)

466 H A N S W O L T E R

Der Gewinn des Minimumverfahrens mit h6herer Belichtungszeit ist des- halb nach G1. (11) und G1. (14)

groin = [sin z . cos z/(sin 2 z + Is)]min. (16)

W~alen wir die Belichtungszeit d.h. das im Graubereich liegende z so, dass g optimal wird, so ist anzusetzen

dgmin/dz = 0 = (sin 2 z + Is)cos 2z -- sin 2z.sin z.cos z (17) d.h. v . . . .

tan z = V'Is(1 + Is) ~ V'?s ~ sin z. (18) Es folgt

' gmin m 1/2VTs fiir Is < 1. (19)

Die Belichtungszeiten verhalten sich umgekehrt wie die Intensit~ten, die in den Graubereich gelegt werden; also ist

Train I(zmax) sin 2 (~/4) + Is 1 - - - - = ~ - - g 2 m i n . ( 2 0 ) Tmax I(zmtn) sin 2 z + Is 41,

Damit ist G1. (12) auch bier best~tigt. Deshalb ist g ~-~ ~/T. ~/m, wenn T die erforderliche Belichtungszeit einer

Aufnahme und m die Anzahl von Aufnahmen ist. Da

g = ~/(A xA c~z) (21 )

nach G1. (3) ist, Iolgt, dass

V T . Vm/g = (AxAaz/~t)VmT (22)

invariant ist gegenfiber Verfahrenswechsel. Das Produkt m. T ist propor- tional der insgesamt ben6tigten Photonenanzahl N, und somit ist

(/tx/io~=lZ) x / N (23)

verfahrensinvariant. Fiir ideales Nachweismittel, das jedes Photon un- abhitngig yon anderen registriert, ist nun abet ffir ein Einzelphoton nach Heisenbergs Unsch~rfebedingung des Elementarprozesses

/ix/io~x/,t = 1; (24)

dabei sind /ix und Aaz die wahrscheinlichen Fehler. Die/iusserste MeBge- nauigkeitsgrenze ist deshalb durch

AxA ~/X = 1 / ~/N (25)

absolut festgelegt. Ftir nicht ideales Nachweismittel (Statistikvergr~berung) gilt allgemeiner

AxAaz/~t = S (N/m) /v '~ (26)

mit der in Teil 4 definierten, fiir das Nachweismittel bei hinreichender Vor-

ZUM GRUNTHEOREM DER INFORMATIONSTHEORIE, IN DER OPTIK 467

vergrSsserung charakteristischen Funktion S(N); nt ist die Anzahl der un- abhiingig voneinander ausgewerteten Aufnahmen.

In den zitierten Gaborschen Arbeiten finden sich mehrere Gleichungen, die mit G1. (23) eine gewisse Verwandtschaft zu haben scheinen; Vorausset- zungen und Geltungsbereiche kSnnen nicht unmittelbar und ohne weiteres auf die hier betrachteten bezogen werden.

7. AuflSsungsverbesserung durch Ob]ekt/eldeinschrdnkung. Die vorher- gehenden Abschnitte zeigen, dass das Expansion-Theorem nicht allgemein- gtiltig ist. Andererseits scheint dieses Theorem aber nach Abbes Theorie des AuflSsungsvermSgens optischer Instrumente, speziell des Mikroskops, zu- treffend fiir die AuflSsbarkeit der Gitterkonstante ax eines unbegrenzten Gitters. Denn bei diesem f~llt bei einer Apertureinschr~tnkung gem~tl3

A (sin ~ ) < 2/a~ (27)

nur noch das Spektrum nullter Ordnung in die Aperturblende. Dieses gibt nur eine Lichtamplitude und enth~ilt keine Aussage fiber die Gitterkonstante, kann daher auch kein Bild ergeben, das irgendeinen Schluss auf die Gitter- konstante zullisst, mSgen wir auch noch so viele Photonen verwenden! Damit scheint das Expansion-Theorem bier gtiltig zu sein.

Doch ist diese Auffassung irrig; denn das Expansion-Theorem setzt j a gerade ein begrenztes Objektfeld voraus, und auch ganz abgesehen yon die- ser Voraussetzung w~ire die Annahme eines unbegrenzt grossen Objektfeldes in der Physik unrealistisch und bzgl. der mathematischen Se.ite der Sache ganz singul~ir. Eine Begrenzung des Objekt_feldes l~tsst aber aus den Punkt- spektren nullter, erster Ordnung usw. eines Gitters ausgedehnte kontinuier- liche Spektralfunktionen yon der Gestalt A n . s i n ( y - 7n) / (7 - yn) wer- den *). Diese entsenden alle noch ,,Ausl~iufer" in die AperturSffnung, tragen zum Bilde bei und lassen aus ibm auch Schliisse auf die Gitterkonstante az zu. Die Entwicklung nach Eigenfunktionen hat dann u.U. einen nullten Koeffizienten, der sehr gross gegeniiber den Koeffizienten hSherer Glieder ist; aber eine hinreichend genaue Vermessung des Bildes l~s t die hSheren Koeffizienten messen und schliesslich die Gitterdaten. Die Aussage des Ex- pansion-Theorems, dass nur n Koeffizienten nach G1. (1) yon 0 verschieden seien, ist dahin abzuwandeln, dass die weiteren Koeffizienten gegeniiber den n Koeffizienten klein sind. Das wird unter der nAchsten Ziffer streng gezeigt werden.

8. Ober die Zweideutigkeit im Beweis des Sampling-Theorems. Dem ein- dimensionalen Sampling-Theorem Shannons in seiner optischen Fassung liegt folgender Sachverhalt zugrunde. Als Objektfunktion/(x) sei die u.U.

*) y sei ,,Koordinate" in der AperturSffnung, ~n sei der Schwerpunkt des Spektrums n-ter Ordnung,

468 HANS W O L T E R

kompleze DurchlaB-Amplitudenfunktion des in der Objektebene (s.Abb. 5) liegenden Objekts bezeichnet. Dies sei ein ,,eindimensionales Objekt," d.h. seine DurchlaBfunktion sei nur v o n d e r Koordinate x abh~ng!g. Beleuchtet werde mit parallelem Licht. Das Objektiv bilde das Objekt auf die ferne Bildebene ab.

Objgkt- Spektrat- I 2" funktion ~X funktion /

• ,,, " , , 1 , 6

= pu..,, \ Z Z l ~"~-

- - v l -G fB(X) funktion Kottimator-- I Kondensor I hintere X

Objekt- b j e " nnebene = B i t d - ebene "~ Aperturebene ebene

Brennweite des Objektivs

A b b . 5. M i k r o s k o p i s c h e A b b i l d u n g m i t O b j e k t f e l d e i n s c h r A n k u n g u n d A p e r t u r -

b e s c h r ~ n k u n g .

Dann ist die Lichterregung, die nach Huygens vom Objekt unter dem Winkel ~z gegen die optische Achse ausgeht, bekanntlich *)

F(sin o~z/x) = f _ + ~ /(x). exp(-- 2zdx sin o~x/~)dx (28)

eine Funktion der ,,Richtvariablen" 7 = sin az/,~, also ist

F(7) = fYoo/(x) , exp ( - 2zdyx)dx; /(x) =- 0 ffir [x[ > G/2. (29)

Da jedem ~ , also auch jedem 7 genau ein Punkt der hinteren Objektivbrenn- ebene (s. Abb. 5) entspricht, werde y als Koordinate in dieser Ebene, die ,,Aperturebene" heisst, benutzt. 7 sei in Analogie zur Fernmeldetechnik ,,Frequenz" genannt, und F(7) heisst Spektralfunktion ; diese ist offenbar die reziprok fouriertransformierte Funktion zu der Objektfunktion /(x).

Umgekehrt ist daher/(x) die Fouriertransformierte yon F(7), also

/(x) - f-%o F(7). exp(2~iyx) d7. (30)

Wird in der Bildebene eine der GauBschen Abbildung der Objektebene ent- sprechende Koordinate (mit MaBstabsvergr6sserung) x analog zur Koordi- nate x der Objektebene definiert, so ist die Bildfunktion in der Bildebene

1~(~) - l ( x ) , (31) wenn keinerlei Beeintr/ichtigung der SpektraKunktion vorgenommen wird. Beschr~nkt man aber durch zwei Spaltbacken mit Kanten an den Orten Y0 bzw. -- 70 den ,,Durchlassbereich" ffir die SpektraKunktion (Abb. 5), so

*) Siehe z.B. [ 13]. Die grundlegende Beschreibung dieser Zusamnlenh~inge s ta tmnt yon F. Z e r n i k e, [14].

ZUM GRUNDTHEOREM DER INFORMATIONSTHEORIE, IN DER OPTIK 469

wird die hierdurch abgewandelte Bild*unktion

/B (x) = f+~o F(~). exp (2~i7x) dy (32)

u.U. yon der Objektfunktion /(x) abweichen. Denn /~(x) ist vom ,,Uber- tragungskanal" der Bandbreite 2yo eine Abwandlung aufgeprigt worden. Gegenstand des Sampling-Theorems ist nun die Frage, inwieweit aus dem so verfilschten /B(X) auf die Objektfunktion/(x) noch zurtickgeschlossen wet- den kann.

S h a n n o n sagt zunichst aus -- und dies sei als richtig unterstellt *) --, dass jede Funktion/B(X), deren Spektralfunktion F(V) ftir [y[ > y0 verschwini- det, als Reihe

IB(X) = ~,oo__oo an. 9n(x) (33) m i t

9n(x) = sin ~(27ox - - n)/~(27oX - - n) (34)

dargestellt werden kann, und dass ffir die qon(x) die Orthogonalititsrela- tionen

0 fiir m :/: n (35) fo~ °~ ~On(X):q~m(x)dx : l/2yo ffir m = n

gelten. Die am sincl einfach Werte von /B(X) an den ,,sampling points" m/2y0; denn am Punkte m/27o ist

]" 0 ffir m ~ n 9n(m/2yo) (36)

1 f f i r m = n

also / B ( n / 2 r o ) = a n (37)

Die Bildfunktion/B(X) ist vollstindig durch die Koeffizienten an, d.h. dutch die Funktionswer~e an den ~iquidistanten ,,Samplingpoints" bestimmt.

Hieraus schliest man fiblicherweise, class nur endlich viele komplexe Zahlenangaben (und zwar so viele, wie Samplingpoints in das Intervall <--G/2; + G/2> fallen, d.h. 27oG-+- 1 ~ 2~,oG komplexe Zahlenangaben) mittels des durch 171 < 70 in der Bandbreite beschrinkten f3bertragungs- kanals tibertragen werden k6nnen und daher weitergehende Schltisse yon der Bildfunktion /B(X) auf die Objektfunktion/(x) unm6glich seien.

Dieser Schluss wire richtig, wenn die ftir /(x) nach Voraussetzung zu- treffende Eigenschaft

/(x) =-- 0 ftir Ix I > ½G

sich auch auf/B(x) ~ibertragen wtirde t) -- oder wenn wir ktinstlich und unn6- tigerweise auf die Messung yon/B(X) ausserhalb des Intervalls 4-- G/2; + G/2> verzichten wfirden.

*) Der Beweis Shannons s) hat vielleicht noch eine Lficke; doch glaubt Verf., dass diese in aller Strenge geschlossea werden kann, wenn geeignete Voraussetzungen formuliert werden.

t) Shannon unterscheidet zwischen/(x) und/B(x) nicht ausdrficklich.

470 HANS WOLTER

Dass aber unter den Voraussetzungen unserer Be t rach tung die Funk t ion /B(x) ausserhalb des Intervalls yon Null verschieden ist, zeigt folgender Satz:

Es #bt genau eine Funktion der Darstellung

sin ~(21'oX -- n) /B(x) = ~,~=_oo an , (38)

~r(2yox -- n)

die fiir Ix I > G/2 identisch verschwindet; dies ist die Funktion [B(x) =--O.

fB Cx )

. . . . I ITT11t4 IIIIIII

G s z

2 % %

/ l l l j l l l l ] l ; ' , : ' , , t s 13

N N ÷-2 A b b . 6 . D i e S a m p l i n g - p o i n t s i m I n t e r v a l l ( - - G / 2 ; + G/2).

Diesen Satz k~Snnen wir auch wie folgt aussprechen: Es gibt keine/ourier- trans]ormierbare Funktion [B(X), die irgendwo yon Null verschieden ist, aber ausserhalb eines Intervalls endlicher Ldnge identisch verschwindet und deren Fouriertrans[ormierte eben/alls ausserhalb eines Intervalls endlicher Ldnge identisch verschwindet.

Zum Beweise nehmen wir an, class/B(x) =-- 0/ f ir Ixl > G/2 sei; dann sind die Reihenkoeffizienten

an = [B(n/21"o) = 0 fiir In/21'ol > ½G; d.h. Inl > 1'oG. (39)

Also ist die Reihe eine endliche *):

sin ~(21'oX -- n) /B(X) ,o+b, oO] an. (40)

= z-,~=-troOj ~(21'0x - - n)

und als Summe endlich vieler ganzer Funkt ionen in der ganzen Ebene re- gul~ir. Wenn nun/B(x) ausserhalb ( - - G/2; + G/2) oder i iberhaupt in einem Interval l verschwindet , dann ist sie als ganze regul~ire Funkt ion identisch Null, was gezeigt werden sollte.

Is t also /B(x) nicht die t iberhaupt auch im Interval l ( - - G / 2 ; + G/2> tiberall verschwindende Funk t ion - - 0 , so ist sie auch ausserhalb dieses Interval ls nicht identisch Null.

Denkbar w~ire freilich noch, class t rotz dieses Satzes stets /B(n/21"O) = 0 w~ire ftir In[ > 1'oG, also an den ausserhalb von ( - - G/2; + G/2) liegenden sampling points. Daftir w~ire mindestens notwendig, class die ,,~iusseren" Nullstellen jeder Funkt ion /B(x), die Bild~unktion (nfit Aper tur [1'1 < I'o)

*) Es sei hier [x] = x ftir x g a n z ; sons t sei [x] die nf ichs tk le inere ganze Zahl zu x.

ZUM GRUNDTHEOREM DER INFORMATIONSTHEORIE, IN DER OPTIK 471

einer ausserhalb ( - - G/2; + G/2) verschwindender~ Funktion ](x) ist, stets ~quidistant sein sollten. Dass ein Satz mit einer solchen Aussage nicht gilt, zeigt neben unbeschr~tnkt vielen anderen das Gegenbeispiel

](x) = 8(x) + 6(x + ½). (41)

Hierin bedeutet 6(x) die Diracsche 6-Funktion ; in diesem Beispiel ist 2V0= 1 gesetzt. Die Bildfunktion ist

]B(X) = (sin ~x/~x) + (sin ~(x + ½)/~(x + ½). (42)

Denn die Nullstellen berechnen sich wie folgt:

0 = (sin ~x/x) + (cos ~x/x + ½) (43)

cotan x = -- 1 -- 1/2x. (44)

Die L6sungen dieser transzendenten Gleichung sind ersichtlich ausserhalb keines Intervalls ~quidistant.

Das Expansion-Sampling-Theorem gilt also sicher nicht in der Form, dass eine Wellenerregung, der ein Objektfeld der Breite Ax = G und eine Apertur der Breite A (sin ~z/~) = A~ = 2~0 zur Verffigung steht, nur

27oG = AxA~ (45)

Informationszahlen (u.U. komplexe) zu iibertragen gestattet. Richtig wfirde dieses Theorem erst dann, wenn zus~tzlich vermerkt wfirde, dass dabei auf Untersuchung der Erregung im ,,Bild" ausserhalb des geometrisch optischen Bildes des Objektintervalls verzichtet wird.

Abb. 7. Aufnahme ~tes in Abb. 8a links gezeigten Gitters mit einer Apertur, die zur Aufl6sung nicht hinreicht. Das Objektfeld wurde durch eine Irisblende eingeschrXnkt. Das Bild zeigt auch ausserhalb des geometrisch optischen Bildes der Iris6ffnung

noch Lichterregungen im Gegensatz zur Hypothese des Sampling-Theorems.

Zur Veranschaulichung zeigt Abb. 7 die Aufnahme eines Gitters mit einer Apertur, die zur Aufl6sung nicht hinreicht. Das Objektgitterfeld wurde

472 HANS WOLTER

durch eine Irisblende eingeschriinkt. Die im Bilde am Rande des Irisblen- denbildes auftretenden Erscheinungen lassen trotzdem Schlfisse auf das Gitter zu. Die Stufen der , ,Randkurve" haben die Breite der Gitterkon- stanten.

Dass die ausserhalb des geometrisch optischen Bildes liegenden Beugungs- fransen einen wesentlichen Beitrag zur Information liefern, ist ftir kleinste Gesichtsfelder, also wenige ,,Sampling-points" viel augerff~illiger als bei vielen Sampling-points. Damit und nicht mit a priori-Informationen h~ingt es zusammen, class die eingangs, z.B. in Ziffer 3 betrachteten Be!spiele (Sternortmessung, Spiegelgalvanometerablesung) besonders plausibel er- scheinen. Aber grunds~itzlich liegt auch jenen einfachsten F~illen das Sampling-Theorem oder besser gesagt das ,,Sampling-Problem" zugrunde.

9. Zur Kiip/miillerbeziehung der Nachrich~ntechnik. In der elektrischen Nachrichtentechnik ist x die Zeit. Dort muss zur vollen Ausnutzung der Information fiber eine in der Zeit T gesendeten Nachricht nicht nur w~ihrend der Zeit T empfangen werden; vielmehr muss das Ausklingen mit beobach- tet werden. Doch werden dort noch weitergehende Bedenken gegen die ge- nannten Theoreme wirksam, da ein Nachrichtenkanal mit einer spektralen Begrenzung Ivl < v0 ein Verstoss gegen die Maxwellschen Gleichungen w~ire. Dort gilt zwar auch der Satz, dass jeder reale Nachrichtenkanal jede Nach- richt mit beliebig hoher Informationsgenauigkeit zu messen gestattet, so- lange weder St/Jrungen noch Quantenstatistik eine Grenze bilden; doch lau- fen die Beweise etwas anders als im optischen Fall, und die Ver6ffentlichung hierzu soll daher gesondert und zwar in einer nachrichtentechnischen Zeit- schrift geschehen.

10. Objekt/eldbeein/lussung und In/ormationsverbesserung *). Zur Vermes- sung eines Gitters bei einer unzureichenden Beobachtungsapertur ist noch geeigneter als die bisher betrachtete Objektfeldbegrenzung eine dem Objekt speziell angepasste Objektfeldbeeinflussung. Legt man z.B. unter das Ob- jektgitter (u.U. etwas schr~ig) ein zweites Gitter -- oder bildet man besser ein zweites Gitter dorthin ab -- so wird bei zweckm~il3iger Bemessung der Hilfsgitterkonstanten eine leichter aufl6sbare Schwebung bemerkbar. Man ver~indert dann die Hilfsgitterkonstante durch Mal3stabs~inderung der Hilfsgitterabbildung oder durch Gitterdrehung, bis die Schwebungsl~inge gegen of geht. Dann sind beide Gitterkonstanten effektiv gleich, und das unbekannte Gitter ist hiermit vermessen worden, obwohl seine Struktur weit unter dem Aufltisungsverm6gen des benutzten Mikroskops liegt.

Die Spezialblende in Form eines Hilfsgitters fiihrt freilich nur dann zum

*) Hier soll der Zusammenhang unseres Problems mit einigen in den letzten Jahren mannigfach diskutierten Gedanken gezeigt werden.

ZUM G R U N D T H E O R E M D E R I N F O R M A T I O N S T H E O R I E , IN D E R OPTIK 4 7 3

Ziel, wenn man weiss, dass ein Gi t ter als Objekt vo~liegt - - wenn man also fiber eine a pr ior i - Informat ion verffigt. Doch ist das nicht charakter is t isch ffir das allgemeine Verfahren der Objektfeldbeeinflussung; denn die einfache Objektfe ldblende ffihrt stets zum Ziel, und noch besser die bewegliche sehr kleine Objektfeldblende, mit der man gleichsam das Objekt abtastet .

Bewegt man eine sehr kleine Lochblende dicht hinter dem Objekt ent- lang, so ist ihr Bild auf der Bildebene u.U. viel gr6sser als das geometrisch optische. Die gesamte Bi ldampli tude gibt dennoch zu jeder Zeit ein verbind- liches Ma6 ffir die Ampli tude an dem Ort des Objekts, an dem z.Zt. die Blende liegt. S ta t t einer zeitlich nacheinander s ta t t f indenden Registr ierung (z.B. mit Photomult ipl ier) kann die Registr ierung auch im r/iumlichen Ne- bene inander durchgeff ihrt werden, wenn man einen engen Spalt schr~g fiber das Gi t te r legt. So hergestell te Aufnahmen zeigen die Abbildungen 8c und 8d.

Abb. 8. Aufnahmen eines Objekts, das aus zwei Gittern besteht, a) mit grosser Apertur; b) mit sehr kleiner Apertur, die zur Auf l6 sung keiner der Gitter ausreicht; c) mit derselben Apertur wie bei b, jedoch mit Schrfigspalt als ObjektfeldeinschrfinlCung; d) wie c, jedoch bei gr6sserer Apertur, die das gr6bere Gitter knapp, das feinere Gitter im Abbeschen Sinne nicht aufzulOsen gestattet. Als Aperturblende diente ein Spalt,

dessen Spaltbacken den Gitterstegen parallel waren.

Abb. 8a gibt die mit grosset Aper tur hergestellte Aufnahme des aus zwei Gi t tern bes tehenden Objekts. b zeigt dasselbe bei einer so kleinen Apertur ,

Physica XX[V

474 HANS WOLTER

dass beide Gitter nicht aufgel6st sind. c zeigt eine Aufnahme bei derselben kleinen Apertur, abet nach Einbringen eines engen Schr~tgspalts unmittelbar vor dem Objektgitter. L~isst man im Bilde 8c den Blick von unten nach oben wandern, so sieht man nacheinander die Bilder, die man sehen wiirde, wenn eine kleine Lochblende vor dem Gitter langsam von links nach rechts bewegt wiirde. Jede der beiden Gitterkonstanten, ja sogar n~ihere Einzel- heiten des Objekts, k6nnen so vermessen werden. Abb. 8d zeigt die ent- sprechende Aufnahme bei etwas gr6sserer Apertur, die bei dem groben Gitter die Aufl6sung im Abbeschen Sinne gerade noch, bei dem feineren Gitter links noch nicht gestattet.

Ad~tiert man alle in Abb. 8c oder d auf einer Vertikalen iibereinander- liegenden Amplituden, so erh/ilt man das Bild, das man ohne Objektfeld- einschr/inkung erhielte; aus c resultiert dann b.

Abb. 9. Dasselbe wie Abb. 8c, jedoch nur far das feinere Gi t ter und mi t Kre isaper tur ; a) mi t stei lem Objekt fe ldspal t ; b) mi t f lacherem Objektfeldspal t .

Die Aperturblende war bei den Aufnahmen zu Abb. 8 ein Spalt, dessen Spaltbacken parallel zu den Gitterstegen lagen. Die analogen Aufnahmen bei kleiner Kreisapertur zeigt Abb. 9a bei steilem und 9b bei flacherem Objekt- feldspalt. Auch hier ist die Gitterkonstante mel3bar, obwohl sie wegen der kleinen Apertur welt unter dem Aufl6sungsverm6gen des Mikroskops liegt.

ZUM GRUNDTHEOREM DER INFORMATIONSTHEORIE, IN DER OPTIK 475

Bei Mien diesen Aufnahmen hatten sowohl die Objektfeldblende (Schr~tg- spMt) als auch die Apertur6ffnung Fli/cheninhalte > ;t2.

Die bier diskutierte ,,Objektabtastung" hat kein Analogon in der Nach- richtentechnik; dort ist x die Zeit, und die Abtastung ist wegen der ,,Ein- maligkeit der Zeit" nicht o.w. rntiglich. Nur bei a priori periodischen Vor- g~tngen gibt es eine Analogie, die zu der bekannten Bandbreitenkompres- sion, nicht aber zu einem VerstoB gegen die Ktipfmtillerbeziehung fiihrt. Die Wiederholung einer Messung und die Abtastung des Objekts demon- strieren wieder das Eingehen der Mel3zeit wie im Abschnitt 6. Doch gibt es bier feinere Unterschiede, die in der oben angekfindigten Ver6ffentlichung behandelt werden: Dort wird auch Abb. 9b nach gl. (1) quantitativ unter- sucht.

11. Strahlungskopplung als Aufl6sungshindernis. Die Abtastung eines Objekts kann prinzipiell mit beliebig kleiner Blende geschehen. Dfirfte man daraus schliessen, dass diese Abtastung stets zu einem Aufl6sungsverm6gen vonde r Gr6sse der Abtast6ffnung fiihrt, so k6nnte man z.B. mit einem Lichtrnikroskop dasselbe Aufl6sungsverm6gen wie mit einern R6ntgen- strahlenmikroskop erreichen. Das wird jedoch durch die Strahlungskopplung zwischen den beleuchteten und den seitlich liegenden unbeleuchteten 0b- jektpunkten behindert. Wie Modellversuche des Verfassers bei 2 = 3 cm bis 3 rn zeigten, betrifft die Strahlungskopplung einen Umkreis von etwa 2/4n bis 2/2n Radius, und zwar im Ergebnis unabh~ingig davon, ob die Abtast- blende vor oder hinter dern Objekt liegt.

Daraus ergibt sich eine prinzipielle Erschwerung ffir die wirksame Ver- wendung der 0bjektfeldbeeinflussung. Das rnit Aperturen der Gr6ssen- ordnung 1 arbeitende Mikroskop ist nicht leicht sehr viel durch Objektfeld- beschr~nkung zu verbessern, da die Aufl6sung ,~/2n ohnehin fast erreicht ist.

Eingegangen 15-2-58

LITERATURVERZEICHNIS

1) Gabor, D., Astronom. optics and related subjects, ed. by Z. Kopal, Amsterdam (1956). 2) Shannon , C., The mathematical theory of communication, University of Illinois Press,

Urbana (1949). 3) Wol ter , H., Ann. Physik (6) 7 (1950) 341. Literaturverz. im Hdb. Physik, Bd. 24, (1956) 644.

4) Kfipfmfi l ler , K., Die Systemtheorie der elektrisehen Nachrichtenfibertragung (1949) 165 5) Shannon , C., Proc. I.R.E. 37 (1949) 10 bis 21. 6) Wol ter , H., Ann. Physik (6} 7 (1950) 342. 7) Wol ter , H., Ann. Physik (6) 19 (1956) 2. 8) Hehvig, N., Diplomarbeit Kiel (1955). 9) Wol ter , H., Z. Physik 135 {1953) 531.

10) Gabor, D., Astronomical optics and related subjects, ed. by Z. Kopal, Amsterdam (1956). II) K r a u s b a u e r , L i se lo t t e , Diplomarbeit Marburg (1957). 12} Wol ter , H., Ann. Physik (6) 7 (1950) 348. 13) Wolter . H., Hdb. Physik 24 (1956) 590. 14) Zernike , F., Physiea ! (1934) 43.