![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/HwFB6/btr6EUmtLdD/wXJSnexZhkirXjbPQjKKok/img.png)
문제 한가지를 설정해보고 베이즈 추정을 통해 문제를 해결해보자. 특정 암에 걸릴 확률은 0.1% (0.001)이라고 하자, 이 암에 걸렸는지를 진단하는 키트가 있고, 이 암에 걸려있는 사람(D)이 진단 키트로 양성 진단(+)을 받을 확률( P(+|D) )은 95%(0.95)이고 건강한 사람(H)이 양성(+)으로 오진 받을 확률( P(+|H) )이 2%(0.02)이다. 당신이 이 검사에서 양성이라고 진단되었을 때, 실제로 암에 걸려있을 확률은? 앞에서 공부한대로 베이즈 추정의 프로세스를 따라 문제를 해결해보자. 베이즈 추정 프로세스를 모르거나 기억나지 않는다면 다음 포스팅을 참고하자 https://biomadscientist.tistory.com/41 1부) 베이즈 통계학의 기초 -1.정보를 얻으면 확률이..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/dsGTuR/btr6BUfC1k5/YhG3rJAPaHZUfOXNVTXpfK/img.png)
1. 벡터와 행렬 : 기계학습에서는 입력된 샘플을 특징 벡터로 표현한다. 벡터는 다음과 같이 로마자 소문자로 표기한다. $$x_1=\begin{bmatrix}5.1\\3.5\\1.4\\0.2\end{bmatrix} x_2=\begin{bmatrix}4.9\\3.0\\1.4\\0.2\end{bmatrix} ... where \ x_1, x_2 \in R^4$$ 이 벡터를 4차원의 벡터라고 이야기하며 다시말해 4차원 실수 공간상의 한 점이 된다. 행렬은 이런 벡터를 여러개 담을 수 있고, 굵은 글씨의 대문자로 표현한다. $$X = \begin{bmatrix}5.1 & 3.5 & 1.4 & 0.2\\ 4.9 & 3.0 & 1.4 & 0.2\\ \vdots & \vdots & \vdots & \vdots \\ ..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/BASN2/btr6pdMH1wb/8Co5QU4UcrJelacy9vnTFk/img.png)
1-1. 베이즈 추정을 이용하면 '쇼핑족'과 '아이쇼핑'족을 판별할 수 있다. 비즈니스에서 실제로 사용될법한 예를 들어 설명해보자, 상품 판매원이 어떤 손님이 들어왔을 때 가장 신경써야 할 부분은 이 손님이 '실제로 지금 매장에서 구매 의사가 있는 손님인가'여부이다. 이렇게 '손님이 실제로 구매 의사가 있는가'를 판단하는 기준은 상당히 모호하지만, 만약 이것을 수치화 할 수 있다면 판매원은 그 기준을 통해 추후 행동을 결정하는데 큰 도움을 받을 수 있을 것이다. 1-2. [1단계] 경험으로부터 '사전확률'을 설정한다. 눈 앞에 손님이 있는 상황을 가정한다. 이 때 베이즈 추정을 이용해 해당 손님이 쇼핑족인지, 아이쇼핑족인지 판단하기 위해 가장먼저 해야하는 일은 '경험으로부터 얻어진, 손님들 중 쇼핑족과 ..
해당 포스팅 시리즈는 전부 아래 도서 내용을 기반으로 작성됩니다. https://book.naver.com/bookdb/book_detail.nhn?bid=11750210&stay=y 세상에서 가장 쉬운 베이즈통계학 입문 비즈니스에 사용할 수 있는 베이즈통계 베이즈통계는 인터넷의 보급과 맞물려 비즈니스에 활용되고 있다. 인터넷에서는 고객의 구매 행동이나 검색 행동 이력이 자동으로 수집되는데, 그로부 book.naver.com GAN이나 VAEs 등 생성모델을 공부하다보면 정말 많은 확률이나 통계적인 이야기, 이해하기 어려운 수학 기호들을 많이 마주하게 된다. 나는 포스팅에서 여러번 얘기하듯 수학적인 개념이 상당히 약하다. 특히나 통계와 같은 내용은 하물며 표준편차가 뭔지, 분산이 뭔지 그 공식조차 기억도..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/bLYMfo/btr3SvoXdab/mAHMZeE2fACTRpogZ0nXU0/img.png)
Transformer를 이용해 protein sequence를 source로, Drug SMILES sequecne를 target으로 사용하는 모델을 만들고 있다. 더보기 Transformer input은 보통 RNN과 다르게 단어의 토큰 시퀀스를 하나씩 순차적으로 전달하지 않고, 문장 하나를 뭉탱이로 Encoder나 decoder로 전달하기 때문에 컴퓨터는 로직상 RNN처럼 순차적으로 전달될때와 다르게 문장이 어떤 순서로 작성되어있는지 이해할 수 없다. 예를 들어보자, "나는 찰옥수수가 들어간 밥을 먹기로 엄마와 약속했다." 라는 문장이 있을 때 이 문장을 RNN으로 전달하면 ['나', '는', '찰옥수수', '가', '들어', '간', '밥', '을', '먹기', '로', '엄마', '와', '약속'..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/M2jVN/btrXSwPaa9V/HbBiX3kasLGapmaqKl4Vb0/img.png)
!! 해당 포스팅에서는 코시의 평균값 정리에 대한 증명만 다룹니다. 롤의 정리와 평균값의 정리는 그림을 통해 자명함이 직관적으로 이해가 가능하므로 증명을 다룰 이유가 없고, 로피탈의 정리의 경우 증명보다는 응용이 더 중요하다고 생각되어 증명내용은 넣지 않았습니다. 로피탈의 정리를 이해하기 위해서는 몇 가지 다른 정리들에 대한 지식이 있어야 한다. 1. 롤의 정리 : 함수 f(x)가 닫힌구간 [a,b]에서 연속이며 열린구간 (a,b)에서 미분 가능하다고 하자, 이 때 f(a) = f(b)이라면 f'(c) = 0을 만족하는 c 값이 (a,b) 사이에 적어도 한 개 이상 존재한다. 말로 들으니 무슨말인지 모르겠다, 그러나 그림으로 그리는 순간? 정리에 대해 명확히 설명하지 않더라도 직관적으로 f'(c) = 0..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/EA2ur/btrXQhQmfHL/IW8UkOYV1IQ0pQEJRvvXz1/img.png)
부끄럽기 짝이없지만 나는 수학을 놓고산지 10년이란 세월이 지나는 바람에 인공지능학과의 석사생이면서도 아주 기초적인 미분공식조차 기억하지 못하는 경우가 상당히 많다. 지수가 어떻고 로그가 어떻고 자연로그가 미분되고 머시기머시기 하다보면 '그랬나?' 라는 생각을 수도없이 하게된다. 매번 까먹어서 기록의 필요성을 느끼므로 기억속에 미처 담지 못한 미분공식이 있을 때마다 적어놓으려한다. 참고 미분해주는 사이트 https://www.derivative-calculator.net/ Derivative Calculator • With Steps! Above, enter the function to derive. Differentiation variable and more can be changed in "Optio..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/1UTD6/btrXmCA3qTT/58L9n7IRkrn6wVgAIqlQqK/img.png)
해당 내용을 이해하기 위해서는 기초적인 수준의 조건부 확률, 베이지안 룰, 결합확률변수와 주변확률변수에 대한 이해가 있어야합니다. 1. 결합확률 변수에 대한 강의는 아래 김성범교수님의 강의를 보시거나 https://www.youtube.com/watch?v=niob_ZRZeJs 2. KMOOC에서 여인권교수님의 8주차 강좌를 통해서 결합확률변수와 주변확률변수에 대한 선수지식을 습득하시길 바랍니다. http://www.kmooc.kr/courses/course-v1:SookmyungK+SM_sta_004k+2019_03SM_02/course/ 강좌 | SM_sta_004k | K-MOOC www.kmooc.kr 3. 조건부 확률에 대한 개념이 없다면 주인장의 블로그 글을 참고하시거나 https://biom..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/b53SSH/btrWTLzIVRl/uiOXWkzs8hd0RHEWd7Aqz0/img.png)
해당 내용은 개인 공부를 위해 작성되었습니다. 아래 공돌이 수학노트님의 영상을 참고한 내용입니다. https://www.youtube.com/watch?v=XhlfVtGb19c 이해 될때까지 공부하자 1. 최대우도법이란 (MLE) 1. MLE는 모수(파라미터)를 이용한 데이터 밀도 추정방법이다. 2. 모수 세타를 아래와 같이 정의할 때, $$ \Theta = (\theta _1,\theta _2...\theta _m)$$ 3. 어떤 확률밀도함수(PDF) P(x | Θ)에서 관측된 4. 표본 데이터 집합 X를 아래와 같이 정의할 때, $$X = (x_1,x_2,...x_n)$$ 5. 표본들로부터 아래의 모수 세타를 추정하는 방법이다. $$ \Theta = (\theta _1,\theta _2...\thet..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/bQYwiI/btrWWsTHzAu/zyKVkFlmbg36Ywy63D62T1/img.png)
해당 내용은 개인 공부를 위해 작성되었습니다. 아래 이상호 선생님의 영상을 참고한 내용입니다. https://www.youtube.com/watch?v=sOtkPm_1GYw 나에게 VAEs를 이해하는데 가장 큰 어려움은 현재 최대우도추정법에 대한 이해가 너무나 헷갈린다는 것이다. 되는대로 모든 영상을 참고하여 공부할 예정이고 공부하면서 이해 안가는 것들을 하나하나 정리해가다보면 언젠가 이해가 되겠지.. 일단 공부해보자. 이런 문제를 마주했다고 생각하자, 일단 항아리에 검은 구슬이 40개정도 들어있을 것으로 유추할 수 있을 것이다. 그러나 도대체 그 근거가 무엇인가? 어떤 이유로 우리는 항아리속에 40개의 검은 구슬이 있었을 것으로 예상하고 답변할 수 있는 것일까? 1. 먼저 우리가 목격한 사건을 확률적인..
- Total
- Today
- Yesterday
- manim library
- MLE
- 베이즈정리
- kl divergence
- 이왜안
- variational autoencoder
- MorganCircularfingerprint
- Matrix algebra
- kld
- eigenvalue
- ai신약개발
- marginal likelihood
- 기계학습
- vae
- 인공지능
- 백준
- ai인공지능
- 오일석기계학습
- elementry matrix
- Manimlibrary
- eigenvector
- 제한볼츠만머신
- 3B1B따라잡기
- 3b1b
- MatrixAlgebra
- 최대우도추정
- manim
- 파이썬
- manimtutorial
- 선형대수
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |