R Studio 사용하기 - 트위터 / 페이스북 크롤링(윈도우즈10) 클라우드/빅데이터/가상화

R-Studio는 R를 사용하기 위한 UI화면이다. R언어를 사용하기 위해선 책을 보면된다. 여기선 간단한 설치 및 실행만 설명한다.
R은 데이터를 분석하기 위한 언어이다. 데이터가 많아지고 복잡해지면서 참 많은 언어가 생겨났다. ㅠㅠㅠ
R-Studio는 실행 결과를 컬럼으로 표시하거나 그래프로 표시해준다. 뭘 보여주는지는 이미지를 "google it"해보자.

1. R-Studio 설치
   R-Studio는 R를 사용하기 위한 UI일 뿐이라 R을 반드시 설치해야 한다.
   하지만 너무너무 편한 기능을 제공하기 때문에 반드시 설치하자.
   아래 사이트에서 License AGPL, Pricing FREE에 해당하는 파일을 다운받아
   설치했다.
   https://www.rstudio.com/products/rstudio/download3/
   https://sourceforge.net/projects/rportable/files/R-Studio/ (Portable)
 
2. R 설치
   아래 사이트에서 "Download R forWindows"를 받아 설치했다.
   https://cran.r-project.org/

3. 트위터 API권한 얻기
   트위터 API를 사용하기 위하여 아래 사이트에서 트위터 계정으로 로그인한다.
   기존에 사용하던 계정 ID, PW로 접속하면 된다.
    https://apps.twitter.com/
    트위터 로그인 -> Create an application -> Keys and Acces Tokens(상단 탭) ->
    Token Actions(Create my access token) 여기까지하면 필요한 토큰을 확인할 수 있다.(아래 그림 참고)
    * 트위터API는 핸드폰 번호가 등록되어 있어야한다. 없다면 여기서 등록 https://mobile.twitter.com/settings

4. R-Studio로 트위터 크롤링하기
   크롤링은 내가 찾고자하는 데이터를 가져오는 것이다. 자연재해, 여론, 이슈, 트랜드등을 알아보기 위하여 많이 사용한다.
   4-1. R-Studio를 실행하여 트위터 크롤링 소스를 오픈하자. (확장자는 R이다.)
        트위터 크롤링 소스는 인터넷에 찾아보면 많이 있다.
        여기서 중요한것은 3번에서 얻은 아래 값을 넣어주는 것이다.
        Consumer Key (API Key), Consumer Secret (API Secret), Access Token, Access Token Secret
   4-2. R스크립트 파일로 오픈하고 해당 스크립트를 실행한다. 화면 상단 우측 위를 보면 "Run"항목이있다.
        이것은 라인단위 실행을 한다.
        혹, 필요한 설치 패키지가 있으면 install.packages("패키지명")이라고하면 R-Studio가 알아서 설치한다.
   크롤링 스크립트는 검색하면 많이 나오니까. 여기선 생략하겠다.

5. 검색 결과를 보여주는 화면이다.
한큐에 실행하기
++++++++++++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++++++++++++
                여기부터 페이스북이다.
++++++++++++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++++++++++++
1. 페이스북 개발자로 등록하기
   아래 사이트로 로그인한다.
   https://developers.facebook.com/apps/

2. "+ 새 앱 추가"로 앱을 만든다.
   새 앱을 만들면 https://developers.facebook.com/apps/로 접속하여 생성한 ID를 확인할 수 있다.(아래 두번째 그림)
   

   앱을 만들면 두가지 코드가 생성된다.
   앱 ID앱 시크릿 코드이다. 시크릿 코드의 경우 "보기"를 클릭하면 Text로 확인할 수 있다.
   앱 ID, 앱 시크릿 코드를 R스크립트의 인증 코드 부분에 넣어주자
   

   fb_oauth코드를 실행하면 http://localhost:1410/ 주소를 등록하라고 나온다. 난 localhost라고 등록했는데 잘된다. 
   localhost:1410을 넣어도 localhost로 바뀐다..ㅠㅠ
   


3. 제품 추가하기
   페이스북의 다양한 서비스를 이용할 수 있다.
  
4. 데이터 추출하기
   소스 화면 처럼 한국 openstack그룹의 데이터를 추출해보자
   오픈스택 사이트는 https://www.facebook.com/openstack/ 이거다.
   getPage(page="openstack", token=fb_oauth, n=30)

5. R-Studio 멀티 코어 사용하기
   명령어 화면에서 install.packages('multicore','http://www.rforge.net/') 라고 입력하여 모듈을 설치한다.
   현 시점(2016-11)까지 R 3.0까지 지원한다. 그 이상 버전에서는 설치 에러가 발생한다.
   스크립트 사용 시 require(multicore)를 선언하여 개발 한다.
   GUI툴에선 Tools -> Install Packages로 설치 가능하다.
   참고 사이트 요기 -> http://www.rforge.net/multicore/

   3.1.x 이상은  require(parallel, quiet=TRUE) 를 사용하자.
      if(!require(foreach)) install.packages("foreach")
      if(!require(doParallel)) install.packages("doParallel")

      library(foreach)
      library(doParallel)
      library(plyr)

      detectCores() # 장비가 몇 코어인지 확인
      workers <- makeCluster(4) # 코어 수
      registerDoParallel(workers)

덧글

댓글 입력 영역