Wolfgang Dalitz Wolfram Sperber Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB)...

Preview:

Citation preview

IuK-Tagung, Darmstadt, 17.3.2004

Wolfram SperberWolfgang Dalitz

Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB)

10. IuK-FrühjahrstagungEducation, Research and New

MediaDarmstadt

15.-18.03.2004

Der Server derInternational Mathematical Union

(IMU)www.mathunion.org

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Inhalt

1. Der IMU Webserver2. IMU-Net3. EWDM4. Professional Homepages5. Math-Net6. Ausblicke

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Was ist eigentlich die IMU?

The objectives of the International Mathematical Union (IMU)

are: a. To promote international cooperation in mathematics b. To support and assist the International Congress of

Mathematicians (ICMs) and other international scientific meetings or conferences

c. To encourage and support other international mathematical activities considered likely to contribute to the development of mathematical science in any of its aspects, pure, applied, or educational

....(aus den Statuten)

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Mitgliederstruktur der IMU

• IMU Mitglieder sind Länder – z.Z. 65 Länder aus 5 Kontinenten

• Jedes Land ist durch eine „adhering organization“ vertreten, welche sein kann:– academy society, – mathematical society– research council – or some other institution or association of

institutions, or an appropriate agency of its government

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Organisationsstruktur

• Executive Committee– „... IMU is administered by an Executive

Committee (EC) ...“• Genaral Assembly (GA)

– „... GA of the IMU consists of delegates appointed by the Adhering Organizations, together with the members of the Executive Committee ...“

• Commissions

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Commissions

• International Commission of Mathematical Instruction (ICMI) [Teaching]

• Commission on Development and Exchanges (CDE)

• International Commission on the History of Mathematics (ICHM)

• Committee on Electronic Information and Communication (CEIC)

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

IMU Webserver (www.mathunion.org)

• Das EC der IMU hat beschlossen, dass der IMU-Server (wieder) nach Berlin kommt

• Redesign (Inhalt und Struktur)• Erweiterungen

– IMU-Net– EWDM– (Awards, Prize Committees, etc.)

• Geplant:– Redaktionssystem– Security

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Ein paar Details

• Struktur lehnt sich an Math-Net Seite für mathematische Gesellschaften an

• z.Z. keine RDF-Daten• Kein Pagemaker• Vorwiegend Außendarstellung und

Berichte der verschiedenen Komitees (CDE, ICMI, CEIC, ...)

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

IMU-Net

• IMU-Newsletter– 2-monatiger elektronischer Rundbrief – „The newsletter aims to improve

communication between IMU and the worldwide mathematical community, by reporting decisions and recommendations of IMU ...“

• Editor– Mireille Chaleyat-Maurel,

Université René Descartes, Paris, France

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Kleines Fazit nach 3 Ausgaben

• Akzeptanz:– Fast 4.000 Abonnenten– Kontinuierlicher Anstieg

• Archiv• ICM 2006

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

EWDM (I)Aus IMU-Net #2:

...“After the discontinuation of the WDM was announced in IMU-Net 1 a number of colleagues asked whether it would be possible to establish an electronic version of WDM. ... Due to the limited financial means of the IMU there is no way to set up and maintain a central registry such as the combined membership list of AMS/MAA/SIAM/etc., ...It seems feasible, though, to keep a central list - based on distributed input and voluntary contributions. CEIC proposes to give this idea a try and start with a basic version of an Electronic World Directory of Mathematicians (EWDM). ...“

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

EWDM (II)

• Registrierungsseite auf dem IMU-Server• Minimalistische Lösung:

– Obligatorisch• Name (lastname, firstname)• E-mail

– Optional• Country• URL der Homepage

• Handshakeverfahren zur Verifikation der Daten (E-Mail)

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Bemerkungen

• Über 600 Einträge in 3 Monaten• Fast alle haben URL und Country• E-Mail-Angabe ist (in erster Näherung) „spam-

sicher“• Zum Teil deutlich mehr an Informationen als

in WDM• Sortierkriterium Namen (default) und Country• Kaum sog. „Professional Homepages“• Seriöse Liste

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Mittelfristige EWDM Aufgaben

• Suchmaschine (in Verbindung mit Persona Mathematica) einsetzen

• Weitere Sortierkriterien und -listen• Update seines Eintrages verbessern

– Z.Z.: Update = Aus- und Neueintragen

• Missbrauchmöglichkeiten verhindern– Spam-Mails– Es soll eine seriöse Liste bleiben, d.h. eine

für MathematikerInnen– Security allgemein

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Verknüpfung EWDM mit dem Personal Homepage Maker

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Langfristige Zielvorstellung

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

... Math-Net ...

• Math-Net wird offiziell von der IMU unterstützt und vom CEIC gelenkt (Steering Gremium)

• In 2003 kaum (nationale) Aktivitäten

• In 2004 Implementierung des Google-Algorithmus auf einer Testmenge der ZIB-Daten

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Google-Idee: PageRank

• Ian Rogers, IPR Computing Ltd., ian@iprcom.com

The Google Pagerank Algorithm and How It WorksLast edited: 16th May 2002

http://www.iprcom.com/papers/pagerank/index.html

In short:"PageRank is a „vote“, by all the other pages on the Web, about how important a page is.A link to a page counts as a vote of support."

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

PageRank als Maß

• Der PageRank eines Webdokumentes kann als ein Maß für die Wichtigkeit eines Dokumentes genommen werden

• Dieses Maß korrespondiert mit dem subjektiven Gefühl der Wichtigkeit eines Dokumentes

• Der PageRank ist relativ leicht (iterativ) zu berechnen

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

PageRank

Sergey Brin and Lawrence PageThe Anatomy of a Large-Scale Hypertextual Web Search Engine

http://www.iprcom.com/papers/pagerank/index.html

"We assume page A has pages T1...Tn which point to it (i.e., are citations). The parameter d is a damping factor which can be set between 0 and 1. We usually set d to 0.85. There are more details about d in the next section. Also C(A) is defined as the number of links going out of page A. The PageRank of a page A is given as follows:

)(

)(...

)1(

)1()1()(

TnC

TnPR

TC

TPRddAPR

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Bemerkungen

"Note that the PageRanks form a probability distribution over web pages, so the sum of all web pages' PageRanks will be one.

PageRank or PR(A) can be calculated using a simple iterative algorithm, and corresponds to the principal eigenvector of the normalized link matrix of the web.

Also, a PageRank for 26 million web pages can be computed in a few hours on a medium size workstation. "

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Einfaches Beispiel

Page A

Page D

Page B

Page C

for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}

K = 1 0.15

0.39

0.15

0.21

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Einfaches Beispiel

Page A

Page D

Page B

Page C

for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}

K = 5 0.19

1.34

0.15

0.65

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Einfaches Beispiel

Page A

Page D

Page B

Page C

for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}

K = 10 1.45

1.54

0.15

0.76

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Einfaches Beispiel

Page A

Page D

Page B

Page C

for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}

K = 20 1.48

1.57

0.15

0.78

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Einfaches Beispiel

Page A

Page D

Page B

Page C

for k=1 .. 40 { $a = 1 - $damp + $damp * $c; $b = 1 - $damp + $damp * ($a/2); $c = 1 - $damp + $damp * ($a/2 + $b + $d); $d = 1 - $damp;}

K = 40 1.49

1.57

0.15

0.78

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Bemerkungen

• Konvergiert relativ schnell• Algorithmus nicht kompliziert• Im „geschlossenem System“ ist

der Average PageRank = 1.0

PR(A) = 1.49PR(B) = 0.78PR(C) = 1.57PR(D) = 0.15----------------- 3.99 / 4 = 1.0

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

PageRank im Math-Net

• ZIB-Daten als Testmenge– 27.000 Dokumente vom Harvest System– Pro Dokument

• URL• URL-References• Weitere Attribute (Metadaten)

– URL-Normalisierung– Vernachlässigung externer Links– 20 Sekunden für k=10 (Perl-Skript)

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Ergebnisse

• Suche nach Groetschel– Homepage ist auf Rang 1 von 799 (!)– Harvest Ranking Algorithmus liefert: Rang 53

• Google reicht aber (ziemlich sicher) nicht:- Suche nach Deuflhard ergibt: Rang 6 von 725– Harvest Ranking Algorithmus liefert: Rang 1

• Kombination beider Bewertungen:– Rang 1 (!) bei beiden

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

Danke für die Aufmerksamk

eit

Iuk-Tagung 2004, Darmstadt Wolfgang Dalitz & Wolfram Sperber

URLs• IMU-Server

– www.mathunion.org

• IMU-Net– www.mathunion.org/IMU-Net

• EWDM– www.mathunion.org/ewdm

• Professional Homepages und EWDM– www.mathunion.org/MPH-EWDM

• Ian Rogers: The Google Pagerank Algorithm ...– www.iprcom.com/papers/pagerank/index.html

• S. Brin, L. Page: The Anatomy of a Large-Scale Hypertextual Web Search Engine– www-db.stanford.edu/~backrub/google.html

Recommended