본문 바로가기

프로그래밍/빅데이터

'실무로 배우는 빅데이터기술' 막히는분 계시죠?

시간이 꽤 지났다

언젠가 트럼프의 대통령 당선을 빅데이터만이 예상했다는 뉴스를 봤었다.

그때는 '뭐 저런게 있구나...'하고 넘어갔었다가

코딩공부를 시작하면서 빅데이터로의 길로 있어 이참에 배워보기로하고 책을 구매했다.

20년 6월에 위키북스에서 나온책이라 별일 없겠지... 하고 구매했지만

문제가 꽤 있더라...

가상환경을 구축하고 하둡에코시스템을 구축하는데 버전이 많이 달라졌더라

가상환경에 OS도 더이상 지원되지 않는 버전으로 진행되기에 여러가지 설정해줘야할게 엄청 많았음

GS반값택배는 포스트잇이 안보여서 잠깐 출연...

그치만 한달 이상 시간을 들이면서 1회독을 끝내고 복습겸 다시 따라해보고 있는데

분명히 나랑같은 상황에 쓸데없는 시간을 보내고 있을것같은 사람들이 있어서 이렇게 글을 써본다.

 

실무로 배우는 빅데이터 기술 (개정2판): 데이터 수집, 적재, 처리 분석, 머신러닝까지

전문 개발자가 아니어도 약간의 소프트웨어 지식만으로 빅데이터의 A~Z까지 기술들을 구현하고 경험해 볼 수 있는 파일럿 프로젝트 형식으로 구성했다. 빅데이터 시스템 구축에 필요한 실무 요

wikibook.co.kr

위 링크로 들어가면 위키북스 공식홈페이지로 연결되고

조금 내린 후 '정오표'를 클릭하면 책을 집필할 당시에는 잘 되던것들을 

현재의 버전에서도 잘 진행되게끔 만들어줄 비밀의 명령어가 적혀져있다.

'정오표'일부

그치만 여기에서도 단방에 해결되지 않는 것들이 있었는데

pip install --upgrade pip

보통 리눅스계열에서 위 코드를 입력하면 업그레이드가 진행되는데

지원이 종료된(?) CentOS 6.1에서는 다시(?) 업그레이드 문구를 안내한다.

알아본바로는 너무 낮은 버전에서 갑자기 높은 버전으로 업그레이드를 진행할때 이와 같은 현상이 발생하므로

버전을 지정해서 조금씩 조금씩 업그레이드를 진행하면 최신버전까지 업그레이드가 가능하다.

쓰다보니 두서없이 쓴것같아 별 도움안 되겠지만

'실무로 배우는 빅데이터 기술' 책을 진행하다가 어려움을 느끼는 사람들이 나처럼 시간 많이 안 흘려보냈으면 좋겠다.

그럼 20000!