R data input & output

기본 튜토리얼

http://www.r-tutor.com/r-introduction/data-frame/data-import

 

불러오기

  • header: 첫 줄을 변수로 읽을 것인가?
  • stringsAsFactors: 문자형 변수를 요인(factor)으로 읽을 것인가? ?False인 경우 factor가 아닌 character로 가져옴
  • na.strings: 결측치 지정
  • comment.char = “#’ : # 이후에 오는 문자는 무시 (주석으로 인식). ?만약 데이터가#을 포함하는 경우에는 # 이후 데이터가 불러와지지 않으므로 주의.
  • sep: 각 관찰값들을 분리해서 읽어오는기준. ?”\t”는 탭으로 분리됨을 의미함.
  • 경로 표시: 슬래시(/)를 사용하거나, 역슬래시 두 개(\\) 사용

data.table FAQ ??http://datatable.r-forge.r-project.org/datatable-faq.pdf

fread의 세부 옵션?https://www.rdocumentation.org/packages/data.table/versions/1.10.4/topics/fread

다양한 read 방법 별 속도 비교 자료 (read.table, fread, sqldf 등등)
https://stackoverflow.com/questions/1727772/quickly-reading-very-large-tables-as-dataframes-in-r/15058684#15058684

 

내보내기(저장하기)

  • file: 파일명 지정
  • row.names: 행 앞에 위치한 숫자를 함께 저장할지? ?특별히 이유가 없다면 false

 

SQL with R

SQL 구문 활용 ?(https://jasdumas.github.io/tech-short-papers/sqldf_tutorial.html 참고)

** ?Online SQL Tryit Editor ?(https://www.w3schools.com/sql/trysql.asp?filename=trysql_op_in)

 

DB에 직접 연결

  • 사용하고 있는 RDBMS에 적합한 library 설치
    • 일반적으로는 RODBC
    • 오라클은 ROracle
    • MySQL은 RMySQL
    • PostgreSQL은 RPostgreSQL

 


Leave Comment

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다