R data input & output


R data input & output

기본 튜토리얼

http://www.r-tutor.com/r-introduction/data-frame/data-import

 

불러오기

  • header: 첫 줄을 변수로 읽을 것인가?
  • stringsAsFactors: 문자형 변수를 요인(factor)으로 읽을 것인가? ?False인 경우 factor가 아닌 character로 가져옴
  • na.strings: 결측치 지정
  • comment.char = “#’ : # 이후에 오는 문자는 무시 (주석으로 인식). ?만약 데이터가#을 포함하는 경우에는 # 이후 데이터가 불러와지지 않으므로 주의.
  • sep: 각 관찰값들을 분리해서 읽어오는기준. ?”\t”는 탭으로 분리됨을 의미함.
  • 경로 표시: 슬래시(/)를 사용하거나, 역슬래시 두 개(\\) 사용

data.table FAQ ??http://datatable.r-forge.r-project.org/datatable-faq.pdf

fread의 세부 옵션?https://www.rdocumentation.org/packages/data.table/versions/1.10.4/topics/fread

다양한 read 방법 별 속도 비교 자료 (read.table, fread, sqldf 등등)
https://stackoverflow.com/questions/1727772/quickly-reading-very-large-tables-as-dataframes-in-r/15058684#15058684

 

내보내기(저장하기)

  • file: 파일명 지정
  • row.names: 행 앞에 위치한 숫자를 함께 저장할지? ?특별히 이유가 없다면 false

 

SQL with R

SQL 구문 활용 ?(https://jasdumas.github.io/tech-short-papers/sqldf_tutorial.html 참고)

** ?Online SQL Tryit Editor ?(https://www.w3schools.com/sql/trysql.asp?filename=trysql_op_in)

 

DB에 직접 연결

  • 사용하고 있는 RDBMS에 적합한 library 설치
    • 일반적으로는 RODBC
    • 오라클은 ROracle
    • MySQL은 RMySQL
    • PostgreSQL은 RPostgreSQL

 


R Basic


R Basic

vector, matrix, dataframe 에 대한 naming, slicing, binding 관련?기본적인 내용 중에

막상 쓰려고 하면 헷갈리는-_- 것들 정리

 


[TIL] 2017-09-01 (금)


  • R 스터디
    • 따라하며 배우는 데이터 과학
      • 회사 도서관에 구입요청해서 빌렸는데, 와 이 책 진짜 짱이다. ?최근에 본 R 관련서적 중에 단연 No.1
      • 덕분에 R 기본 사용법과, Data manipulation, Data visualization 차근차근 복습중
      • Udemy 강의와 병행해서 살펴볼 계획.
      • 바로 주문함 -.-;;;

[TIL] 2017-08-30 (수)


  • 피아노
    • 연습 + 레슨 (2시간)
    • 스케일 속도를 최대한 끌어올려서 손을 긴장시키는 게(?) 흑건 연주에 도움이 된다 >_<
    • 흑건 악센트 잘못 주고 있던 부분 확인
  • 검도
    • 점심시간에 검도
  • 기타
    • Udemy 할인 프로모션에 낚여주기로 했다.
      • ?새로운 강의 4개 추가로 결제 -_-;;; ?이거 언제 다 보지…
    • 항상 쓰면서도 헷갈리는 R 코드랑, 기타 분석하면서 느끼는 소소한 팁들 블로그에 좀 정리하기로 마음먹음
      • 블로그에 R 카테고리 새로 추가!