데이터 분석 엔지니어잡학세상 2022. 8. 5. 13:55
데이터 분석을 하기 위해서는 가장 기본적으로 데이터 전처리를 진행해야합니다. 해당 포스팅은 Hands-Hands-On Machine Learning 책과 코세라 강의 중 How to Win a Data Science Competition: Learn from Top Kagglers를 공부하며 정리하고 데이터 분석을 진행하는 과정을 포함하고 있습니다. 이 포스팅은 캐글 Titanic 생존 예측 분석 데이터를 예시로 진행해볼 예정입니다. 데이터 전처리 과정은 아래와 같이 간단하게 요약할 수 있습니다. 이번 글에서는 Data Clearning, 불필요한 데이터 제거 또는 누락된 데이터를처리하는 방법에 대해서 알아보겠습니다. Data Cleaning : 불필요한 데이터 제거 및 누락된 데이터 처리 Data Ha..
더 읽기
데이터 분석 엔지니어잡학세상 2022. 8. 3. 00:12
코딩 테스트 문제를 풀면서 파이썬을 파이썬 답게 사용할 수 있는 곳이 있습니다. 가격은 무료고, 기본적인 파이썬 지식만 있으면 금방 볼 수 있습니다. 저도 한번 하면서 이해가 안되거나 새로운 내용들을 정리해보았습니다. 간단하게 파이썬 관련된 문제를 풀어보고 싶으시면 따라해보시면 좋을 것 같습니다. - 파이썬을 파이썬답게 : https://programmers.co.kr/learn/courses/4008 몪과 나머지 한번에 구하기 파이썬의 divmod 함수를 사용하면 한번에 출력 가능 a = 7 b = 5 print(*divmod(a, b) 문자열 정렬하기(ljust, center, rjust) 문자열을 좌측/가운데/우측 정렬하는 파이썬 함수를 사용할 수 있습니다. '가나다라 ' # 좌측정렬 ' 가나다라'..
데이터 분석 엔지니어잡학세상 2022. 5. 26. 21:38
머신러닝이란? 머신러닝(Machine learning)이란 말 그대로 "기계학습"입니다. 인간이 직접 가르치는 기계를 의미하는 것이 아닌, 무언가를 스스로 학습하는 기계를 의미합니다. 기계를 학습한다는 것은 사람이 하는 일들을 학습시켜 특정 작업을 아주 빠른 속도로 수행하기 위함입니다. 위키피디아에서 정의한 머신러닝은 컴퓨터가 외부에서 만들어진 방대한 빅데이터를 바탕으로 스스로 학습하는 알고리즘이라고 볼 수 있습니다. 위 예처럼 수신한 이메일이 스팸인지 아닌지 구분하도록 훈련하는 알고리즘을 개발하여 지속적으로 데이터를 입력 한 다음 학습하도록 하여 특정 이메일의 스팸 여부를 구분해 낼 수 있습니다. 또한 머신러닝은 데이터 안에서 규칙을 발견하고 그 규칙을 새로운 데이터에 적용해서 새로운 결과를 도출할 수..