분류 전체보기 (56) 썸네일형 리스트형 [TIL] 머신러닝 심화 4주차 ★ 딥러닝 원리와 아키텍쳐 1. 딥러닝 개요 1) 머신러닝 VS 딥러닝 공통점) 데이터로부터 가중치를 학습하여 패턴을 인식하고 결정을 내리는 알고리즘 개발과 관련된 AI의 하위분야 차이점) 머신러닝 : 데이터 안의 통계적 관계를 찾아내며 예측이나 분류를 하는 방법 딥러닝 : 머신러닝의 한 분야로 신경세포 구조를 모방한 인공신경망을 사용함 2) 가중치를 구해라- 회귀 문제에서 최소화 하려는 값은?가중치를 이리저리 움직이면서 최소의 MSE를 도출해내면 된다 이렇게 최소화하려는 값을 목적함수 또는 손실함수라고 명명경사하강법 : 모델의 손실함수를 최소화하기 위해 모델의 가중치를 반복적으로 조정하는 최적화 알고리즘. 변수 X가 여러개 있다면 동시에 여러개의.. [TIL] 머신러닝 심화 3주차 ★ 비지도 학습★ 정답이 없는 데이터를 다루는 비지도 학습에 대해서 군집화 알고리즘을 통해 알아보기 1. K-Means Clustering 1) k-means clustering 이론 ● 수행순서1. k개 군집 수 설정 2. 임의의 중심을 선정 3. 해당 중심점과 거리가 가까운 데이터를 그룹화4. 데이터의 그룹의 무게 중심으로 중심점을 이동5. 중심점을 이동했기 때문에 다시 거리가 가까운 데이터를 그룹화 (반복) ▶ 정리장점) - 일반적이고 적용하기 쉬움단점) - 거리 기반으로 가까움을 측정하기 때문에 차원이 많을수록 정확도가 떨어짐 - 반복 횟수가 많을수록 시간이 느려짐 - 군집 개수 정하는것이 주관적임 - 평균을 이용하기 때문에(중심점) 이상.. [TIL] 머신러닝 심화 2주차 ★ 회귀, 분류 모델링 심화에 대하여 : 선형회귀와 로지스틱 회귀 외에 자주 쓰는 알고리즘 알아보기 1. 의사결정나무와 랜덤 포레스트 1) 의사결정나무 (Decision tree): 의사결정 규칙을 나무 구조로 나타내어 전체 자료를 몇개의 소집단으로 분류하거나 예측을 수행하는 분석 방법 루트노드 : 의사결정나무의 시작점, 최초의 분할 조건리프 노드 : 루트 노드로부터 파생된 중간 혹은 최종 노드분류기준 : sex는 여성인 경우 0, 남성인 경우 1로 인코딩 - 여성인 경우 좌측 노드/ 남성인 경우 우측 노드불순도 : 불순도 측정 방법 중 하나인 지니계수는 0과 1사이 값으로 0이 완벽한 순도(모든 샘플이 하나의 클래스), 1은 완전한 불순도(노드의 샘플의 균등하게 분포) 를 나타냄리프 노드로 갈.. [아티클] 기획자가 알아야 할 데이터 분석 도구와 활용법 https://yozm.wishket.com/magazine/detail/2141/ 기획자가 알아야 할 데이터 분석 도구와 활용법 | 요즘IT기획자로서 성공적인 프로젝트 진행을 위해 데이터 분석은 필수적인 요소입니다. 그렇다면 효과적인 데이터 분석을 위해 필요한 도구는 무엇일까요? 이번 글에서는 수많은 데이터 분석 도구 중yozm.wishket.com ● 전체적인 글의 요약 - 데이터를 효과적으로 분석하고 인사이트를 도출하려면 강력한 도구들이 필요하다 - 기업의 목적에 따라 사용하는 도구가 전부 다르기 때문에, 각 도구의 특징과 활용방법을 파악하여 현재 조직 상황에 올바른 도구를 선택해야 한다 - 하지만 데이터 분석 도구는 의사결정을 위한 하나의 수단일 뿐이며, 핵심은 데이터 분석 도구를 통한 의사결정 .. [코드카타] 알고리즘 ● 카드뭉치 (LV.1) 정답)def solution(cards1, cards2, goal): for i in goal: if cards1 and i == cards1[0]: cards1.pop(0) elif cards2 and i == cards2[0]: cards2.pop(0) else: return 'No' return 'Yes' - 원하는 단어 배열 goal에서 하나씩 단어를 꺼내며, 그 단어가 cards1 또는 cards2의 첫번째 인덱스와 같으면 pop을 해준다- goal의 모든 단어를 반복하며 원하는 단어 배열이 만들어지면 yes, 만약 순서가 맞지 않는다면 no를 반환할 것이다.. [아티클] 조직 상황에 맞는 BI 툴 고르기 https://yozm.wishket.com/magazine/detail/1794/ 조직 상황에 맞는 BI 툴 고르기 | 요즘IT회사에서 어떤 툴을 이용해 데이터를 보시나요? 다양한 조직에서 BI 툴(Business Intelligence Tool) 도입을 통해 대시보드를 구축하여, 조직의 빠른 데이터 기반 의사결정을 돕고 있습니다. 최근에는yozm.wishket.com 1. 조직에서 BI 툴이 필요한 이유- 우리는 비즈니스에서 데이터를 기반으로 의사결정을 함- 특히 급변하는 비즈니스 환경 속에서는 데이터를 보고 빠르게 의사결정을 할 수 있는 BI 대시보드가 필요하다 2. 우리 조직에 맞는 BI 툴은? ★ 조직에 적합한 BI 툴을 선정하는 Tip! 1) 데이터 드리븐 문화 조성 : BI.. [아티클] A/B 테스트 제대로 이해하기: A/B 테스트에 적당한 표본과 주의사항 https://yozm.wishket.com/magazine/detail/1680/ A/B 테스트 제대로 이해하기: ⑤ A/B 테스트에 적정한 표본과 주의 사항 | 요즘IT지금까지 ‘A/B 테스트 제대로 이해하기’ 시리즈를 통해 A/B 테스트의 기본 정보와 가설, 세팅 방법, 그리고 분석 결과 등 여러 정보를 정리했다. 시리즈의 마지막인 이번 글에서는 기획자, PM, 마yozm.wishket.com "표본은 얼마나 필요한가?" 에 대한 질문은 두 방안의 차이가 어느 정도 되기를 기대하느냐에 따라 다르다표본이 많을수록 두 안의 결과 차이가 작더라도 실험 결과가 통계적으로 유의미할 수 있다표본이 작더라도 두 안의 결과 차이가 크면 통계적으로 유의미할 수 있다> A/B 테스트 수행 과정에서 주의할 점 1) 내.. [아티클] A/B 테스트 제대로 이해하기: (4) A/B 테스트 표본 크기와 유의미한 결과의 관계 https://yozm.wishket.com/magazine/detail/1667/ A/B 테스트 제대로 이해하기: ④ A/B 테스트 표본 크기와 유의미한 결과의 관계 | 요즘IT이전 글에서 기초 통계 지식을 바탕으로 A/B 테스트 계산기의 세팅 방법과 해석에 관한 내용을 살펴보았다. 이때 해석 내용 중 계산기에서 ‘결과가 유의미하지 않다(Not Significant)’라고 했을 때yozm.wishket.com Q. 표본 사이즈와 유의미한 결과는 무슨 상관이 있을까?생각 1 : 표본의 수가 많을수록 좋은 것 같다고 생각함그렇다면 표본이 많을수록 '더 적은 차이도 인정해준다' 는 것인가??만약 10명중 2명이 나온 A와 10명 중 3명이 나온 B를 비교할때, 단 한명의 차이로 B그룹이 승리한 것처럼 보.. 이전 1 2 3 4 ··· 7 다음