RDD와 함께 스파크 활용하기.
-이번장에서 배울 것 0.메모리에서 데이터 또는 파일로 RDD를 어떻게 생성할지 -RDD는 여러 타입이 될 수 있다. 1.단일 타입: integers, characters, booleans, etc. 2.시퀀스 타입: strings, lists, arrays, tuples, dicts, etc.(nested 데이터 타입 포함.) 3.Scala/Java Object(serializable인 경우) 4.Mixed Types -몇몇 RDD 타입은 추가적인 기능을 가지고 있다. -Pair RDDs: 키와 값을 쌍으로 가지는 형태 -Double RDDs: 숫자 데이터로 구성된 형태 -RDD를 시퀀스 타입의 데이터에서 바로 가져와본다. myData = [‘Alice’,’Carlos’,’Frank’,’Barbara’..
2019. 12. 15.