RapidMiner telepítés i
RapidMiner telepítés
RapidMiner telepítés ii
COLLABORATORS TITLE : RapidMiner telepítés ACTION
NAME
DATE
SIGNATURE
WRITTEN BY
Jeszenszky, Péter
2014. szeptember 17.
REVISION HISTORY NUMBER
DATE
DESCRIPTION
NAME
RapidMiner telepítés iii
Tartalomjegyzék 1
RapidMiner telepítés
1
2
Az R Extension telepítése
1
2.1
Windows . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2.1.1
R telepítés
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2.1.2
JAVA_HOME környezeti változó beállítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2.1.3
rJava és JavaGD telepítés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2.1.4
R_HOME és PATH környezeti változó beállítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2.1.5
R Extension telepítés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
2.1.6
RapidMiner újraindítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Linux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2.1
R telepítés
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2.2
JDK telepítés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2.3
rJava és JavaGD telepítés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2.3.1
R_HOME és PATH környezeti változó beállítás . . . . . . . . . . . . . . . . . . . . . . . . . .
4
2.2.3.2
R Extension telepítés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
2.2.3.3
RapidMiner újraindítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.2
3
4
JDBC meghajtóprogramok telepítése
5
3.1
HSQLDB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
3.2
Oracle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
Hivatkozások
6
RapidMiner telepítés iv
Ábrák jegyzéke 1.
Az R Extension telepítési leírása (Windows) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
2.
A jri.dll állomány kiválasztása (Windows) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
3.
Az R Extension telepítésének befejezése (Windows) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
4.
Az ikonsor az R Extension telepítése után (Windows) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
5.
Az R Extension telepítési leírása (Linux) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
6.
A libjri.so állomány kiválasztása (Linux) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
7.
Az ikonsor az R Extension telepítése után (Linux) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Kivonat
A dokumentum a RapidMiner program telepítésével és beállításával kapcsolatos témákat tárgyal.
RapidMiner telepítés 1/7
1.
RapidMiner telepítés
A RapidMiner Windows és Linux rendszerekben is telepíthet˝o rendszergazdaként. Ennek nyilvánvaló el˝onye az, hogy a program minden felhasználó számára rendelkezésre áll a továbbiakban. Ebben az esetben viszont a Help → Update RapidMiner. . . menüpont kiválasztásával csak a rendszergazda képes az alaprendszer frissítésére, további csomagokat azonban minden felhasználó telepíthet. megjegyzés A szerzo˝ Linux alatt rendszergazdaként az /opt könyvtárba telepítette a programot.
2.
Az R Extension telepítése
Az R Extension az R statisztikai és grafikai környezetet [4] integrálja a RapidMiner-be. Telepítése sajnos nem teljesen automatikusan történik, hanem »kézi« beállításokat is igényel. A szakasz lépésr˝ol-lépésre haladva mutatja be a telepítés menetét.
2.1.
Windows
2.1.1.
R telepítés
Telepítsük az R-t, mely a http://cran.r-project.org/bin/windows/base/ oldalról tölthet˝o le. A jelenleg aktuális verzió a 3.1.1 számú. 2.1.2.
JAVA_HOME környezeti változó beállítás
Be kell állítani a JAVA_HOME környezeti változót, melynek értékeként a Java installációt tartalmazó könyvtár elérési útvonalát kell megadni. Ha a számítógépünkre telepítve van az Oracle Java fejleszt˝oi csomagja (JDK) akkor a környezeti változó értéke legyen az ezt tartalmazó könyvtár elérési útvonala. Például a szerz˝o számítógépén ez C:\Program Files\Java\jdk1.8.0_05. Az sem baj, ha nincs JDK telepítve, mivel a RapidMiner részeként is kapunk egy Java futtató környezetet (JRE). Ebben az esetben az ezt tartalmazó könyvtár elérési útvonalát kell megadni a környezeti változó értékeként. Például a szerz˝o számítógépén ez C:\Program Files\Rapid-I\RapidMiner5\jre. 2.1.3.
rJava és JavaGD telepítés
Indítsuk el az R-t adminisztrátor jogosultsággal és telepítsük benne az rJava csomagot [5], mely lehet˝ové teszi az R számára Java objektumok használatát, valamint a JavaGD grafikus eszközmeghajtó csomagot [3], mely a grafikus kimenet Java alkalmazásokhoz történ˝o átirányítására szolgál. A telepítés elvégezhet˝o a parancsértelmez˝oben az > install.packages(c("rJava", "JavaGD"))
parancs végrehajtásával vagy a Packages → Install package(s). . . menüpont kiválasztásával. Mindkét esetben megjelenik egy CRAN mirror cím˝u ablak, melyben a csomagok letöltéséhez ki kell választani egy szervert. Bármelyik megfelel˝o, de célszer˝u egy földrajzilag közelebbi választása, a szerz˝o az ausztriai szervert ajánlja. 2.1.4. R_HOME és PATH környezeti változó beállítás
Állítsuk be az R_HOME környezeti változót, melynek értékeként az R installációt tartalmazó könyvtár elérési útvonalát kell megadni. Ez például a szez˝o számítógépén C:\Program Files\R\R-3.1.1. A PATH környezeti változó értékéhez pedig adjuk hozzá annak a könyvtárnak az elérési útvonalát, melyben az R részeként kapott R.dll állomány található. Ez az R 2.12.0 és magasabb számú verziói esetén %R_HOME%\bin\i386 illetve %R_ HOME%\bin\x64 – 32-bites operációs rendszer esetén az el˝obbit, 64-bites esetén pedig az utóbbi kell használni –, korábbi verziók esetén pedig %R_HOME%\bin.
RapidMiner telepítés 2/7
2.1.5. R Extension telepítés
Indítsuk el a RapidMiner programot és telepítsük benne az R Extension kiterjesztést a Help → Updates and Extensions (Marketplace). . . menüpont kiválasztásával. A kiterjesztés telepítése után a programot újra kell indítani. Az újraindítás után meg fog jelenni egy olyan ablak, mely a telepítés és beállítás lépéseit ismerteti, itt a Select JRI library file gombra kattintva mehetünk tovább (1. ábra).
1. ábra. Az R Extension telepítési leírása (Windows) A 2. ábra azt a következ˝o ablakot mutatja, melyben meg kell keresnünk az állományrendszerben az rJava csomaghoz tartozó jri.dll állományt. Például a szerz˝o számítógépén az állomány a C:\Program Files\R\R-3.1.1\library\ rJava\jri\x64 könyvtárban található. tipp ˝ A jri.dll állomány helyének meghatározásához az R parancsértelmezojében hajtsuk végre a
> .libPaths() parancsot. Az állományt a parancs eredményeként kapott könyvtárak valamelyikében találjuk az rJava\jri\i386 illetve a ˝ rJava\jri\x64 alkönyvtárban. 32-bites operációs rendszer esetén az elobbiben, 64-bites esetén pedig az utóbbiban lévo˝ jri.dll-t kell használni.
2. ábra. A jri.dll állomány kiválasztása (Windows) A jri.dll állomány kiválasztása után az Manually restart RapidMiner gombot megnyomva lépjünk ki a programból (3. ábra).
RapidMiner telepítés 3/7
3. ábra. Az R Extension telepítésének befejezése (Windows)
2.1.6.
RapidMiner újraindítás
Ha sikeres volt a telepítés, akkor a RapidMiner következ˝o indításánál az ablak tetején az ikonsorban megjelenik az R Extension ikonja (4. ábra).
4. ábra. Az ikonsor az R Extension telepítése után (Windows)
2.2.
Linux
Az alábbi leírás az Ubuntu és Linux Mint rendszerekben történ˝o telepítés menetét ismerteti. 2.2.1.
R telepítés
Telepítsük az R-t, melyhez a $ sudo apt-get install r-base
parancsot kell végrehajtani. 2.2.2.
JDK telepítés
Telepítsük az Oracle JDK-t. A telepítés során gondoskodjunk arról is, hogy kerüljön beállításra a JAVA_HOME környezeti változó, melynek értékeként a JDK installációt tartalmazó könyvtár elérési útvonalát kell megadni. Például a szerz˝o számítógépén a beállítást az /etc/profile.d/jdk.sh állomány tartalmazza az alábbi módon: ... export JAVA_HOME=/usr/lib/jvm/java-8-oracle ...
2.2.3. rJava és JavaGD telepítés
figyelem ˝ Az alábbiakhoz szükséges, hogy megfeleloen be legyen állítva a JAVA_HOME környezeti változó!
Telepítsük az rJava csomagot [5], mely lehet˝ové teszi az R számára Java objektumok használatát, valamint a JavaGD grafikus eszközmeghajtó csomagot [3], mely a grafikus kimenet Java alkalmazásokhoz történ˝o átirányítására szolgál. A telepítést az alábbi parancsok végrehajtásával végezzük el: $ $ > >
sudo R CMD javareconf sudo R install.packages(c("rJava", "JavaGD")) q("no")
A csomagok telepítése során megjelenik egy CRAN mirror cím˝u ablak, melyben a letöltéséhez ki kell választani egy szervert. Bármelyik megfelel˝o, de célszer˝u egy földrajzilag közelebbi választása, a szerz˝o az ausztriai szervert ajánlja.
RapidMiner telepítés 4/7
2.2.3.1. R_HOME és PATH környezeti változó beállítás
Állítsuk be az R_HOME környezeti változót, melynek értékeként az R installációt tartalmazó könyvtár elérési útvonalát kell megadni. Ez például a szez˝o számítógépén /usr/lib/R. A PATH környezeti változó értékéhez pedig adjuk hozzá az $R_ HOME/bin könyvtárat. A beállításokhoz hozzuk létre az /etc/profile.d/rapidminer.sh állományt az alábbi tartalommal: export R_HOME=/usr/lib/R export PATH=$PATH:$R_HOME/bin
2.2.3.2. R Extension telepítés megjegyzés Ezt a lépést már nem szükséges rendszergazdaként végezni akkor sem, ha a RapidMiner programot rendszergazdaként telepítettünk. Minden egyes felhasználó saját maga is elvégezheti az alábbiakat. Viszont az R_HOME és PATH környezeti ˝ változók megfeleloen be kell, hogy legyenek állítva!
Indítsuk el a RapidMiner programot és telepítsük benne az R Extension kiterjesztést a Help → Updates and Extensions (Marketplace). . . menüpont kiválasztásával. A kiterjesztés telepítése után a programot újra kell indítani. Az újraindítás után meg fog jelenni egy olyan ablak, mely a telepítés és beállítás lépéseit ismerteti, itt a Select JRI library file gombra kattintva mehetünk tovább (5. ábra).
5. ábra. Az R Extension telepítési leírása (Linux) A 6. ábra azt a következ˝o ablakot mutatja, melyben meg kell keresnünk az állományrendszerben az rJava csomaghoz tartozó libjri.so állományt. Ez például a szez˝o számítógépén az /usr/local/lib/R/site-library/rJava/jri/ könyvtárban található.
RapidMiner telepítés 5/7
tipp A következo˝ módon állapíthatjuk meg, hogy hol található a szóban forgó libjri.so állomány. Indítsuk el az R-t és hajtsuk végre az alábbit:
> .libPaths() A kimenetben megjeleno˝ valamely könyvár alatt találjuk az rJava/jri/ könyvtárat, mely az állományt tartalmazza.
6. ábra. A libjri.so állomány kiválasztása (Linux) A libjri.so állomány kiválasztása után a Manually restart RapidMiner gombot megnyomva lépjünk ki a programból. 2.2.3.3.
RapidMiner újraindítás
Ha sikeres volt a telepítés, akkor a RapidMiner következ˝o indításánál az ablak tetején az ikonsorban megjelenik az R Extension ikonja (7. ábra).
7. ábra. Az ikonsor az R Extension telepítése után (Linux)
3.
JDBC meghajtóprogramok telepítése
A RapidMiner részeként több JDBC meghajtóprogramot is kapunk, melyek lehet˝ové teszik különböz˝o relációs adatbáziskezel˝orendszerek elérését. Sajnos azonban a program nem biztosít Oracle JDBC meghajtóprogramokat, és a tartalmazott HSQLDB [1] meghajtóprogram sem a legfrissebb. A szakasz ezeknek a hiányosságoknak a kiküszöbölésére ad megoldást [2] alapján. A JDBC meghajtóprogramokat a RapidMiner installációt tartalmazó könyvtárban kell elhelyezni a lib\jdbc (Windows) illetve lib/jdbc (Linux) alkönyvtárban. Ez például a szerz˝o számítógépén Windows alatt a C:\Program Files\Rapid-I\ RapidMiner5\lib\jdbc könyvtár.
RapidMiner telepítés 6/7
3.1.
HSQLDB
A HSQLDB legutóbbi stabil verziója a 2.3.2 számú, a RapidMiner pedig jelenleg a korábbi 1.8 verzióhoz tartalmaz meghajtóprogramot, mely az újabb HSQLDB verziókhoz nem használható. Töltsük le a http://sourceforge.net/projects/hsqldb/files/hsqldb/ oldalról a program megfelel˝o verzióját, melyet egy hsqldb-x.y.z.zip nev˝u állomány tartalmaz. A tömörített állományban található hsqldb-x.y.z/ hsqldb/lib/hsqldb.jar állománnyal írjuk felül az állományrendszerben a korábbi hsqldb.jar állományt.
3.2.
Oracle
A http://www.oracle.com/technetwork/database/features/jdbc/index-091264.html oldalról tölthetjük le az Oracle JDBC meghajtóprogramokat. Például az Oracle Database 11g verziókhoz az ojdbc6.jar állományt kell letölteni és elhelyezni a fenti könyvtárba.
fontos Az órai munkához az Oracle Database 11g Release 1 meghajtóprogramokat válasszuk.
A RapidMiner programot futtató felhasználók .RapidMiner könyvtárába el kell helyezni az alábbi tartalmú konfigurációs állományt jdbc_properties.xml néven, ahol a 4. sorban értelemszer˝uen a meghajtóprogam elérési útvonalát kell megadni: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Linux rendszerekben a konfigurációs állomány helye az állományrendszerben a $HOME/.RapidMiner5 könyvtárban van. Windows alatt például a szerz˝o számítógépén a C:\Felhasználók\Jeszy\.RapidMiner5 könyvtárban kellett elhelyezni az állományt. megjegyzés A szerzo˝ tapasztalatai szerint az Oracle JDBC meghajtó Linux alatt a jdbc_properties.xml állomány nélkül is használható.
4.
Hivatkozások [1] HSQLDB (HyperSQL Database), http://hsqldb.org/ .
RapidMiner telepítés 7/7
[2] JDBC Drivers – Rapid-I-Wiki, http://rapid-i.com/wiki/index.php?title=JDBC_Drivers . [3] rJava – Java Graphics Device, http://www.rforge.net/JavaGD/ . [4] The R Project for Statistical Computing, http://www.r-project.org/ . [5] rJava – Low-level R to Java interface, http://www.rforge.net/rJava/ .