Upload
trinhtruc
View
218
Download
0
Embed Size (px)
Citation preview
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
Webinar@Lunchtime:
SAS Data Step 2 – next generation
Karin Gross
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
ModerationAnne K. Bogner-Hamleh
SAS Institute GmbH
Education Consultant
Xing-Profil:http://www.xing.com/profile/AnneKatrin_BognerHamleh?key=0.0
WEBINAR@LUNCHTIME HERZLICH WILLKOMMEN BEI WEBINAR@LUNCHTIME
Hinweise zum Ablauf des Webinars:
• Teilnehmer sind automatisch “stumm” geschaltet
• Sie können Nachrichten an den Moderator senden und Fragen stellen
• die Veranstaltung wird aufgezeichnet
TrainingKarin Gross
SAS Institute GmbH
Manager SAS Education
Services
Xing-Profil:http://www.xing.com/profile/Karin_Gross2
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
AGENDA
• Was ist DS2?
• Warum DS2?
• Was ist neu in DS2?
• Wo kann der DS2 ausgeführt werden?
• Wann nutze ich DS2?
• Einführung in ein DS2-Programm
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
FRAGE
Mögliche
Antworten
FRAGE (MEHRFACHAUSWAHL MÖGLICH)
Welche dieser SAS Programmiersprachen nutzen Sie?
a.Base SAS
b.SQL
c.Makro
d.DS2
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
• Ersetzt NICHT den Base SAS Data Step
• Data Step DNA ist klar erkennbar
• DATA und SET Anweisungen
• IF...THEN...ELSE, DO Schleifen
• Ausdrücke und Funktionen
• Arrays
• Aber es ist ein neuer DATA Step
• Keine INFILE, INPUT, MERGE, UPDATE, MODIFY Anweisung
• Methoden, Packages und Variablen-Gültigkeitsbereiche
WAS IST DS2?WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WAS IST DS2?
• DS2 ist eine neue SAS Programmiersprache:
• ist Bestandteil von Base SAS
• hat eine ähnliche Syntax wie der Base SAS DATA Step
• bietet weiterführende Techniken zum Datenmanagement
proc ds2;data _null_;
method init();Text='Hello, World!';put Text=;
end;enddata;run;quit;
data _null_;Text='Hello, World!';put Text=;
run;
Base SAS DATA Step DS2 DATA Step
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WARUM DS2?
• SASige Dinge ausführen an bisher unbekannten Orten
• Moderne Programmiertechniken und -strukturen
• Strikte Variablendeklaration (optional)
• Gültigkeitsbereiche von Variablen
• Methoden
• Vordefinierte (INIT, RUN, TERM)
• Benutzerdefinierte
• Variablenkapselung
• Packages
• Vordefinierte (HASH, SQLSTMT, Logger, FCMP, …)
• Benutzerdefinierte
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WAS IST NEU IN DS2?
• DS2 verbessert die Erweiterbarkeit und Wiederverwendbarkeit von Code
durch den Einsatz von Methoden und Packages.
Methoden und Packages können vordefiniert oder benutzerdefiniert sein.
Package
Method A… method code …
Method B… method code …
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WAS IST NEU IN DS2?
• DS2 unterstützt ANSI SQL Datentypen für das exakte Datenmanagement.
• Beispiele:
Datentyp Beispiele
Rationale Zahlen DECIMAL, DOUBLE, FLOAT, REAL
Ganzzahlen BIGINT, INTEGER, SMALLINT, TINYINT
Datum und Zeit DATE, TIME, TIMESTAMP
Text CHAR, NCHAR, VARCHAR,
NVARCHAR
Numerische Variablen im “alten” DS: DOUBLE
Alphanumerische Variablen im “alten” DS: CHAR
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WAS IST NEU IN DS2?
• Base SAS DATA Step verarbeitet alle Beobachtungen sequentiell.
• DS2 kann Beobachtungen parallel verarbeiten.
DS2 DS2 DS2
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WAS IST NEU IN DS2?
• Mit dem SAS In-Database Code Accelerator kann DS2-Code in Datenbanken
ausgeführt werden (Greenplum, Teradata, Netezza, HADOOP).
RDBMS
DS2 DS2 DS2
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WIE WERDEN DS2 PROGRAMME ERSTELLT?
• DS2-Programme werden in einer dieser Prozeduren erstellt:
• PROC DS2
• PROC HPDS2
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WANN NUTZE ICH DS2?
• DS2 kann auf Daten aus den folgenden Datenquellen zugreifen:
• Für den Zugriff auf Daten des DBMS wird FedSQL genutzt.
Aster
DB2
Greenplum
MYSQL
Netezza
ODBC-kompatible
Datenbanken
SAS Dateien
SAP
SPD Engine Dateien
Sybase IQ
Teradata
Hadoop
Oracle
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WANN NUTZE ICH DS2?
• DS2 Einsatz am besten in folgenden Situationen:
• Nutzen der verteilten Verarbeitung
• komplexe Berechnungen
• Ausführung in Massively Parallel Processing (MPP) Datenbanken
• DS2 Datentypen für die Exaktheit der Berechnungen erforderlich
• Einsatz der Wiederverwendbarkeit von DS2 Methoden und Packages.
DS2?
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
GRUNDLEGENDE SYNTAX
• PROC DS2 kann drei verschiedene Elemente enthalten:
• DATA Step
• Package
• Thread
• PROC DS2 verwendet Run-Group Verarbeitung.
proc ds2;package work.pgk;
<more program statements>endpackage;run;thread work.thread;
<more program statements>endthread;run;Data work.newDataset;
<more program statements>enddata;run;quit;
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
GRUNDLEGENDE SYNTAX
• DS2 DATA Step
• beginnt mit einer DATA Anweisung
• endet mit einer ENDDATA Anweisung
• benötigt zur Ausführung eine RUN Anweisung.
ds2_helloWorld
proc ds2;data _null_;
method init();Text = 'Hello, World!';put Text=;
end;enddata;run;quit;
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
proc ds2;data _null_;
method init();Text = 'Hello, World!';put Text=;
end;enddata;run;quit;
GRUNDLEGENDE SYNTAX
• Neu in DS2: Methoden
• Methoden sind benannte ausführbare Codeblöcke.
• Die METHOD Anweisung benennt die Methode.
• Die END Anweisung beendet die Methode.
• Ausführbarer Code steht immer IN einer Methode.
• Methoden sind global.
• Variablen können global oder lokal sein.
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
GRUNDLEGENDE SYNTAX
• Systemmethoden werden automatisch ausgeführt.
• INIT() – einmal zu Beginn
• RUN() – einmal für jede Zeile
• TERM() – einmal am Ende
ds2_basicMethods
data _null_;method init();
dcl varchar(20) Text;Text='**> Starting';put Text;
end; method run();
set orion.banks;put _all_;
end;method term();
dcl char(11) Text;Text='**> All done!';put Text;
end;enddata;run;
WEBINAR@LUNCHTIME
data _null_;/* Section 1 */if _n_ =1 then do;
Text='**> Starting';put Text;
end;
/* Section 2 */set orion.banks end=last;put _all_;
/* Section 3 */if last then do;
Text='**> All done!';put Text;
end;run;
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
BEISPIEL EINER EINFACHEN DS2 METHODE
• Benutzerdefinierte Methoden
• können Argumente haben
• können einen Wert liefern
• werden beim Aufruf ausgeführt
• können mehrmals aufgerufen werden.
PROC DS2;data c2f_conv(overwrite=yes);
declare double degC degF;method c2f(double tC) returns double;
declare double tempValue;/* Celsius to Farenheit */tempValue = ( ( tC * 9 ) / 5 ) + 32;return ( tempValue );
end;method init();
do degC = 0 to 30 by 2;degF = c2f(degC);output;
end;end;
enddata;run;QUIT;
WEBINAR@LUNCHTIME
ds2_user_method_example
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
GEMEINSAMKEITEN MIT DEM DATA STEP
Vieles ist ähnlich:
• Set Anweisung: Tabelle einlesen
• BY Group Verarbeitung mit
• First. und Last.
• DO Gruppen & Schleifen
• DO I= start TO stop BY interval
• DO WHILE () / DO UNTIL ()
• CONTINUE, LEAVE, END
• RETURN, GOTO, STOP, OUTPUT
• KEEP, DROP, RETAIN, RUN
• DS2: nur außerhalb von Methoden
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
SECHS „KLEINE UNTERSCHIEDE“
1. Ausführbarer Code muss innerhalb einer Methode stehen.
2. Dateien, Threads und Packages werden nicht automatisch überschrieben,
Einsatz von overwrite=yes.
3. Neue Variablen sollten deklariert werden, s. SCOND Option für Proc DS2
oder DS2SCOND System Option.
4. Schlüsselwörter sind Reservierte Wörter (da gibt es eine ganze Liste… )
5. Ausgabe mit Zeilensteuerung in der PUT Anweisung wird nicht unterstützt,
PUTLOG gibt es nicht.
6. ‘ bzw. “ – jetzt ANSI Standard:
doppelte Anführungszeichen ⇒ Name (Case sensitive)
einfaches Hochkomma ⇒ Textkonstante
%TSLIT macht einfache Hochkommata um aufgelöste Makrovariablenwerte.
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
ZUSAMMENFASSUNG
Was?
• Neue SAS Programmiersprache
• DATA Step ähnliche Syntax mit verteilter Verarbeitung
Warum?
• SAS an Stellen, die nie zuvor ein SAS gesehen haben
• Viel mehr Datentypen
• Moderne Programmmiertechniken und -strukturen
• Gültigkeitsbereiche von Variablen
• Packages
• Methods
• Threads
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
ZUSÄTZLICHE INFORMATIONEN
• DS2 and FedSQL
• SAS 9.4 DS2 Language Reference, Second Edition
PDF (24.47MB) | HTML
• SAS 9.4 FedSQL Language Reference, Second Edition
PDF (13.13MB) | HTML
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
FRAGE
Mögliche
Antworten
FRAGE (MEHRFACHAUSWAHL MÖGLICH)
Welche Eigenschaft des DS2 ist für Sie am
spannendsten?
a.Wiederverwendbarkeit des Codes durch Packages
b.Verteilte Verarbeitung mit Threads
c.Gleiche Datentypen wie in der Datenbank
d.Ausführung von Programmen mit dem SAS In-Database
Code Accelerator
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
FRAGEN?
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
VIELEN DANK FÜR IHRE TEILNAHME
Interesse an weiterem Austausch?
• Diskutieren Sie mit uns in der XING-Gruppe Business Analytics mit SAS
• Sprechen Sie uns direkt an:[email protected]
• Advanced Analytics Course Series 2015:
• September – Oktober 2015
• International bekannte Referenten
• spannende Kurse zu Data Mining und Text Mining, SAS Visual Analytics und SAS Visual Statistics, Forecasting und Fraud Detection
WEBINAR@LUNCHTIME
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
WEITERE INFORMATIONEN UND KURSE ZU DIESEM THEMA…WEBINAR@LUNCHTIME
• Wissen kompakt: SAS® Programmierung mit dem Data Step 2
11.09.15 Köln
02.12.15 Heidelberg
• SAS® Programmierung mit dem Data Step 2 für Hadoop
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
NÄCHSTES WEBINAR@LUNCHTIME:
WHAT‘S NEW IM SAS ENTERPRISE GUIDE 7.11
22. SEPTEMBER 2015
Copyr i g ht © 2014, SAS Ins t i tu t e Inc . A l l r ights reser ve d . www.SAS.com
FOLIEN ZUM DOWNLOAD UNTER
WWW.SAS.DE/LUNCHTIME
WIE HAT IHNEN UNSER WEBINAR GEFALLEN?