Twitter: @grzegg
Kategoria: programowanie, Tagi: - - .

R – warte zainteresowania środowisko do statystyki, obliczeń i prezentacji danych

Jakiś czas temu natknąłem się, buszując po sieci, na R. Pod tą literką kryje się, jak piszą autorzy na swojej stronie, darmowe środowisko do obliczeń statystycznych i grafiki. Rzeczywiście, za darmo można pobrać oprogramowanie które oferuje naprawdę ogromne możliwości. Cóż więc dokładnie oferuje R?

Przede wszystkim jest to środowisko które umożliwia wydajną pracę z danymi, polegającą na przykład na sortowaniu, wyszukiwaniu, a przede wszystkim dokonywaniu na nich obliczeń, szczególnie statystycznych. Bogactwo dostępnych testów statystycznych powinno zaspokoić nie tylko zwykłych studentów czy badaczy ale także osoby o bardzo wysublimowanych wymaganiach. R stosuje się również do naukowych symulacji komputerowych – można go traktować po prostu jako język programowania o szczególnie dobrym wsparciu dla operacji statystycznych.
Inną ważną zaletą omawianego oprogramowania jest wsparcie dla wizualizacji danych. Można więc tworzyć wszelkiego rodzaju wykresy, histogramy, a nawet rysunki. Na stronie projektu w sekcji Screenshots można znaleźć galerię z licznymi przykładami.

Dla wielu osób mankamentem może być to, że nie jest to typowy arkusz kalkulacyjny, dla przeciętnego użytkownika komputera utożsamianego z Excelem. Po zainstalowaniu oprogramowania (o czym następnym razem) nie otrzymujemy okienka w którym możemy wpisać liczby w kratki a następnie wyklikać rezultat. Zamiast tego, szybko okazuje się, że praca z R to w zasadzie programowanie, co może odstraszyć kogoś, kto nigdy wcześniej tego nie robił. Ale, jak ktoś kiedyś powiedział, wszystko dla ludzi. Warto więc przełamać się i spróbować powalczyć, a raczej zaprzyjaźnić z R. Może okazać się, że gra warta jest świeczki, że wysiłek włożony w naukę zwróci się wielokrotnie. O ile oczywiście potrzebujemy tego typu oprogramowania, R nie jest bowiem uniwersalnym narzędziem do wszystkiego i w wielu przypadkach arkusz kalkulacyjny jest wystarczającym a nawet lepszym wyborem.

Kiedy może nam się przydać R?
Z moich doświadczeń wynika, że świetnie sprawdza się szczególnie wtedy gdy mam dane, na których muszę dokonać przeształceń/obliczeń, dokonać analizy statystycznej a na końcu utworzyć serię wykresów. Zwłaszcza, jeśli tą serię operacji będę musiał wielokrotnie powtarzać dla nowych danych. Wtedy można napisać jeden skrypt przeprowadzający kolejne operacje, a następnie w razie potrzeby podmienić tylko plik z danymi i w ciągu kilku sekund otrzymać wyniki oraz wykresy dla nowych danych. R sprawdza się też doskonale w dużo mniej skomplikowanych zadaniach. Często używam go na komputerze jako… podręczny kalkulator.

W przyszłości chcę umieścić tu serię wpisów dotyczących R. Zaznaczam, że nie jest moim zamiarem pisanie kompletnego przewodnia po tym środowisku ani elektronicznego podręcznika. Jestem skromnym użytkownikiem R któremu daleko do pozycji eksperta. Raczej chcę napisać serię krótkich tutoriali które pokażą jak krok po kroku wykonać określone, niezbyt skomplikowane zadania, z którymi może się spotkać student czy badacz.

Zainteresowanych, gorąco zachęcam do sięgnięcia do dużo bardziej kompletnych opracowań. Większość dostępnych jest oczywiście w języku angielskim, ale coraz więcej pozycji można także znaleźć w języku polskim, np:

  • Przemysław Biecek – Przewodnik po pakiecie R (wyd. 2)
  • Tomasz Górecki – Podstawy statystyki z przykładami w R
  • Walesiak Marek, Gatnar Eugeniusz – Statystyczna analiza danych z wykorzystaniem programu R

Oczywiście mnóstwo materiałów dostępnych jest w Internecie.
;

Leave a Reply