Belépés
Hogyan :Ket gep virtualis egyesitese
2010. január 23. – 16.55 – Gyorgy
Szervusztok,
Nagy adatokat ( tablazatokat ) szeretnek feldolgozni ( 12 x 20 000 sor x 15 oszlop ).
Ebbol egy db 20 000 sor x 15 oszlop -os tablazat feldolgozasa is nagyon lassu az IBM T41-el.
( Jaunty, OpenOffice 3.0)
Emiatt ket gepet szeretnek 'kozos igaba' kotni, azaz helyi halozaton kersztul valamilyen modon megosztani/egyesiteni eroforasaikat.
Nincsenek idevago ismereteim, bar hallomasbol ugy remlik, lehetseges volna a gep virtualizatio, vagyis a ket gep egykent valo mukodtetese.
Kerlek szepen javitsatok ki, ha tevedek ( es nezzetek el e teren valo muveletlensegemet ), illetve ha megis lehetseges -szabad szoftverrel - , kerlek szepen segitsetek a hogyan tekinteteben.
A segitseget, tanacsokat elore is koszonom.
Udv
Zold Gyorgy
- A hozzászóláshoz regisztráció és belépés szükséges
Elnézést, hogy nem a kérdésre válaszolok, de én megvizsgálnám helyedben azt a kérdést is, hogy az Openoffice-e a legjobb választás ekkora adatmennyiség feldolgozásához.
+1
awk egyszerre csak egy sort olvas be, és ha 'feldolgozta' megy csak a következőre, így kisebb a gépigénye, és nem hinném hogy kevesebbet tud mint az ooo sőt.. :)
az attól függ mennyire számításigényes a feladat.
amire gyorgy gondol az cluster, de egyrészt nem hinném hogy van olyan open source free megoldás amit használhatnál, illetve ami van, igen komoly ismereteket és speciálisan clusterre írt szoftvermegoldást igényel. szerintem az ooo nem ilyen, magyarán ilyen célra használni nem tudod.
Why use windows, if you have open doors... to linux... Pythonkodjunk!
Statisztikakat szukseges az adathalmazbol kesziteni, raadasul ugy, hogy a kimeneti adatok az MS vilaggal (excell) legyenek kompatibilisek.
Az input adatok az MS - Winmentor nevu szamviteli programbol szarmaznak, excell-be exportalva.
A CSV elég platformközi megoldás. A 20k sor egy táblázatkezelőnek sem kellene sok legyen, de egy awk-szerű szkriptnyelvnek se kottyan meg. Bár nem tudom, mit jelent itt a statisztika.
Nem ismerek olyan megoldást, amivel az OOo-t (vagy akár az Excelt) tudnád lazán csatolt rendszeren futtatni.
Statisztikára, ábrakészítésre, adatokra való illesztésre munkámból kifolyólag sokat használom a linuxomat. Nekem eddigi tapasztalatom az volt, hogy adatok manipulálására :) az "awk"-ban szinte mindent meg lehet csinálni. Az ábrakészítésre és illesztésre pedig ajánlom a "gnuplot" nevezetű csodaprogramot:).