Computer#

하드웨어

초기부터 비싼 하드웨어 장비로 시작할 필요는 없습니다. 시작 단계에서는 지금 사용하시는 노트북 한대로 충분합니다.

추후 진행하려고 하는 데이터 사이언스 프로젝트가 지속적인 서비스를 제공해야 한다면, 24시간 켜놓을 서버 용도로 따로 컴퓨터를 마련하는 것이 좋습니다. 쓰지 않는 구형 노트북이나 데스크탑을 활용해 보시는 것도 좋습니다.

좀 더 투자해서 머신러닝에 특화된 GPU가 장착된 제품(장비빨^^)을 찾으신다면 개인 레벨에서는 아래 장비를 고려해 볼만 합니다.

  • Lambda Lab (https://lambdalabs.com/)

    • 요즘 딥러닝 노트북을 검색하면 많이 회자되는 회사입니다. 선택할 수 있는 하드웨어 사양은 System76보다 적습니다. A/S 는 단점입니다.

  • System76 (https://system76.com/)

    • Linux용 기기를 전문으로 제작하는 회사입니다. 고사양 CPU/RAM/GPU(nVidia) 모두 지원하며 Linux와 하드웨어 호환성 걱정은 없지만, A/S는 단점입니다.

요즘 맥북의 M1 칩에서 머신러닝속도가 잘나온다는 이야기가 있는데 추후 기기가 생긴다면 테스트 해볼 만 할거 같네요.

youtube

운영체제

개인 데이터 사이언스를 위한 개발 환경의 경우에는 운영체제가 별로 중요하지 않습니다. 다만 E2EDS 를 위한 플랫폼들의 베이스는 대부분 리눅스 환경위에서 구동되기 때문에 리눅스 사용을 추천합니다. 요즘은 가상화 기술이 많이 발전 되어 VM 을 사용하면 리눅스 사용이 개발 환경에서 리눅스 사용이 가능하지만, GPU 및 다양한 하드웨어 자원의 사용 및 Docker 등 컨테이너 환경을 자유롭게 사용하기 위해서는 리눅스가 최적의 선택입니다.

운영체제 가상화 툴은 윈도우/맥 모두 무료로 사용할 수 있는 Virtualbox를 이용해도 되고, 맥에서 좀더 편하게 이용하고 싶다면 유료인 Parallels 를 사용해도 무방합니다.

윈도우에서 Virtualbox를 이용하여 Ubuntu 20.04 LTS 설치하기 (Youtube)

youtube

맥에서 Virtualbox를 이용하여 Ubuntu 20.04 LTS 설치하기 (Youtube)

youtube

Virtual Machine 계열의 가상화 툴들은 성능 저하를 어느정도 감수해야 하기 때문에 개발을 계속 진행하다보면 docker 라는 경량화 가상화 도구를 사용하게 될 겁니다.

docker 가 맥/윈도우 에서도 지원되긴 하지만 Virtual Machine 상에서 돌아가기 때문에 성능 및 네트워크 구성 시 문제를 겪게 될 가능성이 높습니다. 하지만, 리눅스의 경우에는 docker 가 경량화된 프로세스레벨로 돌아가기 때문에 이런 문제에서 자유롭습니다.