IT 잡학세상 엔지니어잡학세상 2023. 1. 11. 01:20
요즘 가장 관심이 많은 것은 머신러닝입니다. 머신러닝을 공부하다보니 결국 인공지능이 보이고 인공지능을 위해서는 결국 빅데이터가 필요합니다. 캐글이 실제 프로젝트를 위한 곳이라면 DataCamp(https://www.datacamp.com/) 강의는 실제로 파이썬이나, R등 프로그래밍 언어 경험이 없어서 기초부터 실전까지 다양한 코스를 경험할 수 있습니다. 제가 지금 진행하고 있는 과정은 Data Scientist with Python입니다. 총 84시간 과정이고 22개의 코스로 이루어져 있습니다. DataCamp의 모든 강의는 영어로 이루어져 있습니다. 하지만 강의는 짧게 하고 대부분 실습이기 때문에 크게 영어라는 것이 어렵게 느껴지지 않습니다. 저의 첫번째 목표는 이 과정을 다 끝내는 것입니다. 파이선..
더 읽기
IT 잡학세상 엔지니어잡학세상 2022. 7. 6. 02:02
앞으로 4차산업 혁명에 대해 많이들 이야기 하고 있습니다. 특히 그 기술 중 사물인터넷, 드론, 3D프린터, 머신러닝, 빅데이터 등 새로운 분야들이 많이 연구되고 상용화 되고 있죠. 하지만 일반적으로 쉽게 경험하기 힘들고 낯설게 느껴지는게 사실입니다. 특히 인공지능 분야도 마찬가지죠. 인공지능 분야가 발전하기 위해 가장 기초가 되는 것은 빅데이터라고 할 수 있습니다. 이런 빅데이터를 쉽게 활용하는 방법에 대해 소개하고자 합니다. 일전에 트렌드 분석을 위한 빅데이터에 대한 포스트에서도 소개한 적이 있는 구글 트렌드 입니다. 구글 트렌드 활용하기 구글 트렌드(바로가기)는 전 세계 구글을 통해 검색하는 검색량을 기반으로 한 트렌드 예측 도구 입니다. 사람들은 자신이 관심이 있는 것을 더 많이 검색한다라는 가정..
데이터 분석 엔지니어잡학세상 2022. 5. 26. 21:38
머신러닝이란? 머신러닝(Machine learning)이란 말 그대로 "기계학습"입니다. 인간이 직접 가르치는 기계를 의미하는 것이 아닌, 무언가를 스스로 학습하는 기계를 의미합니다. 기계를 학습한다는 것은 사람이 하는 일들을 학습시켜 특정 작업을 아주 빠른 속도로 수행하기 위함입니다. 위키피디아에서 정의한 머신러닝은 컴퓨터가 외부에서 만들어진 방대한 빅데이터를 바탕으로 스스로 학습하는 알고리즘이라고 볼 수 있습니다. 위 예처럼 수신한 이메일이 스팸인지 아닌지 구분하도록 훈련하는 알고리즘을 개발하여 지속적으로 데이터를 입력 한 다음 학습하도록 하여 특정 이메일의 스팸 여부를 구분해 낼 수 있습니다. 또한 머신러닝은 데이터 안에서 규칙을 발견하고 그 규칙을 새로운 데이터에 적용해서 새로운 결과를 도출할 수..
IT 잡학세상 엔지니어잡학세상 2022. 5. 25. 20:53
일반인도 쉽게 빅데이터 분석 서비스를 접근할 수 있고 특히 네이버 등 여러 사이트에서 검색을 하기 때문에 검색어 순위도 하나의 트렌드 지표가 될 수 있습니다. 이와 같은 유명 사이트에서 일반인들에게 빅 데이터를 활용한 정보를 제공하고 있습니다. 최근 트렌드를 알기 위해 키워드를 검색할 때 주로 사용하는 방법입니다. 오늘은 일반인들이 쉽게 사용할 수 있도록 빅데이터 분석 서비스를 제공하는 사이트에 대해 소개하겠습니다. NAVER DataLab 바로가기 : https://datalab.naver.com/ 우리나라에서 아직까지 많이 사용하고 있는 포털사이트는 네이버입니다. 네이버는 초창기부터 실시간 검색어라는 서비스를 사용하여 실시간으로 트렌드를 나타냈습니다. 그 실시간 검색어를 모아서 보여주는 곳이 바로 네..