๐ง ๋์ฒด ์๊ทธ๋ชจ์ด๋(Sigmoid) ํจ์๊ฐ ๋ญ๋ฐ?!
on
์๊ทธ๋ชจ์ด๋(Sigmoid) ํจ์
์๊ทธ๋ชจ์ด๋ ํจ์๋ S์ํ ๊ณก์ ๋๋ ์๊ทธ๋ชจ์ด๋ ๊ณก์ ์ ๊ฐ๋ ์ํ ํจ์์ด๋ค. ์๊ทธ๋ชจ์ด๋ ํจ์์ ์์๋ก๋ ์ฒซ ๋ฒ์งธ ๊ทธ๋ฆผ์ ํ์๋ ๋ก์ง์คํฑ ํจ์๊ฐ ์์ผ๋ฉฐ ๋ค์ ์์์ผ๋ก ์ ์๋๋ค.
์ถ์ฒ: ์ํคํผ๋์
๐๐ปโโ๏ธ ๋ค์ด๊ฐ๋ฉฐ
ML/DL์ ๊ณต๋ถํ๋ค ๋ณด๋ฉด Activation ํจ์๋ก ์๊ทธ๋ชจ์ด๋ ํจ์๋ฅผ ์์ฃผ ๋ง๋๊ฒ ๋๋ค. ํน์ ํต๊ณํ์์๋ Logistic ๋ถํฌ, Normal ๋ถํฌ, t-๋ถํฌ์์๋ ์๊ทธ๋ชจ์ด๋ ๊ณก์ ์ด ์์ฃผ ๋ฑ์ฅํ๋ค. ์ด๋ป๊ฒ ์ด๋ฐ ํจ์๊ฐ ๋ฑ์ฅํ๋์ง ์ ์ฌ์ฉํ๋ ์ง ์ดํด ๋ณด๊ณ ์ ๊ธ์ ์์ฑํ๊ฒ ๋์๋ค.
๐ฃ ๋ถ๋ฅ์ ๊ฐ๋ฅ์ฑ์ ํ๋ฅ๋ก ์๊ธฐ ํ๊ธฐ
๊ธฐ์กด ํ๊ท ๋ชจํ์ ๋ฌธ์ ์ ๋ค
- Target Label์ด 1์ด์ 0์ดํ์ ์๋ค์ด ๋์ค๋ ๊ฒ์ ์ด๋ป๊ฒ ํด์ ํ ๊ฒ์ด๋?
- 1 ๋๋ 0์ผ๋ก ์ ํํ ํํ ๊ฐ๋ฅ ํ๊ฐ?
- ๋ณ์๊ฐ Y์ ์ํฅ์ ์ฃผ๋ ์ ๋๊ฐ ๋น๋กํ๋ ๊ฐ?
- ํ๋ฅ ๋ก ๋ฐ์ํ ์ฌ๊ฑด์ ๊ฐ๋ฅ์ฑ์ ํํํด์ผ ํจ
๐๐ปโโ๏ธ ์ด๋ค ์ฌ๊ฑด์ด ์ผ์ด๋ ํ๋ฅ
Sigmoid ํจ์ ํน์ Logistic ํจ์๋ฅผ Odds ratio๋ฅผ ํตํด ๊ตฌํด์ง๊ฒ ๋๋ค.
- ์ผ์ด๋ ํ๋ฅ : $ P(X)$
- ์ผ์ด๋์ง ์์ ํ๋ฅ : $1 - P(X)$
- $0 โค P(X) โค 1$
์์ ๊ฐ์ด $ P(X)$ ๋ฅผ ์ ์ ํ์. ๊ทธ๋ฌ๋ฉด Odds Ratio๋ก ๋ํ ๋ผ ์ ์๋ค.
Odds Ratio
ํด๋น ์ฌ๊ฑด์ด ์ผ์ด๋ ํ๋ฅ ๊ณผ ์ผ์ด๋์ง ์์ ํ๋ฅ ์ ๋น์จ
\[\frac{P(X)}{1-P(X)}= \frac{์ผ์ด๋ ํ๋ฅ }{์ผ์ด๋์ง ์์ ํ๋ฅ }\]์ ์์์ ๊ทธ๋ํ๋ก ๋ํ๋ด๋ฉด ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋๋ค. ํ๋ฅ ์ด ๋์ผ๋ฉด ๋์ ์ ๋ก Odds ๊ฐ์ด ๋ฌดํ์ด ์ฆ๊ฐํ๋ ๊ทธ๋ํ์ ๋ชจ์์ด ๋ํ๋๋ค.
์ฐ๋ฆฌ๊ฐ ์๊ณ ์ถ์๊ฒ์ $X$ ๊ฐ์ด ์ฃผ์ด์ก์ ๋์ ํ๋ฅ ์ ์๊ณ ์ถ๋ค. ๋๋ฌธ์ $X$ ๊ฐ๊ณผ $Y$ ๊ฐ์ ๋ฐ๊ฟ๋ณธ๋ค. ์ฆ, ์ญํจ์๋ฅผ ๊ตฌํด๋ณธ๋ค. ์ด๋, ์ด๊ฒ์ ๊ตฌํ๊ธฐ ์ํด Logit ํจ์๋ฅผ ์ด์ฉํ๋ค.
Logit function
X๊ฐ์ด ์ฃผ์ด์ก์ ๋ y์ ํ๋ฅ ์ ์ด์ฉํ Log odds๋ฅผ ๊ตฌํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
\[\begin{align} logit(p(y=1|x)) &= log_e(\frac{p}{1-p}) \\ &=log_e(p) - log_e(1-p)\\ &= -log_e(\frac{1}{p} - 1) \end{align}\]์ด๋ ๊ฒ ์ป์ ๊ฐ์ ๊ทธ๋ํ๋ก ํ์ํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
$ P(X)$ํ๋ฅ ์ผ ๋์ Logit(P)์ ๊ฐ์ ๊ตฌํ๋ ๊ทธ๋ํ ์ด๋ค. ํ์ง๋ง, ์ฐ๋ฆฌ๋ $X$ ๊ฐ์ด ์ฃผ์ด์ก์ ๋์ ํ๋ฅ ์ ์๊ณ ์ถ๊ธฐ ๋๋ฌธ์ ์ญํจ์๋ฅผ ๊ตฌํด์ผ ํ๋ค.
Sigmoid(=Logistic) ํจ์
Logitโ ํจ์์ ์ญํจ์๋ก $ z$์ ๊ดํ ํ๋ฅ ๋ก ๊ตฌํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
\[\begin{align} f(z) =\, &y = -log_e(\frac{1}{z}-1) \: \text{์ญํจ์ ๋ณํ} \\ &z = -log_e(\frac{1}{y}-1) \: \text{y ์ ๊ดํ ์ ๋ฆฌ} \end{align}\]์ฌ๊ธฐ์ $z$๊ฐ์ ์์์ ์ด์ผ๊ธฐ ํ๋ $P(X)$ ํ๋ฅ ์ ์๋ฏธํ๋ ๊ฒ์ด๊ณ , ์ฆ ์ด์ ์์ผ๋ก ๊ตฌํ๊ฒ ๋๋ ์ด๋ค ๊ฐ์ผ ๋งํ๋ค. ์ด๊ฒ์ ๋ค์ ๋ค์๊ณผ ๊ฐ์ด ๋ณํํ๋ฉด Logistic ํจ์๋ฅผ ์ป์ ์ ์๋ค.
\[\begin{align} &z = -log_e(\frac{1}{y}-1)\\ &e^{-z} = \frac{1-y}{y}\\ &y*e^{-z} + y = 1\\ &y(e^{-z} + 1) = 1\\ &y = \frac{1}{1+e^{-z}} \end{align}\]์ด๋ ๊ฒ ์ป์ด์ง ํจ์๋ฅผ Logistic ํจ์๋ผ๊ณ ํ๊ณ . ๋ชจ์์ด ๋ค์๊ณผ ๊ฐ์ด Sํํ๋ก ๋ฎ์๋ค๊ณ ํ์ฌ Sigmoid ํจ์๋ผ๊ณ ํธ์นญํ๋ค. ์ด ํจ์์ ๊ฐ์ฅ ์ค์ํ ํน์ง์ ์ฐ์๊ตฌ๊ฐ์์ ๋ฏธ๋ถ ๊ฐ๋ฅํ ํํ๋ฅผ ๋๋ค๋ ์ ์ด๋ค.
์ ํ ํจ์์์ Sigmoid ํจ์๋ก ๋ณํ
๋ค์๊ณผ ๊ฐ์ด Logit ํจ์๋ฅผ ์ ์ฉํด์ ๊ธฐ์กด์ ํ๊ท์์ผ๋ก ๋ค๋ฃฐ ์ ์์๋ ํ๋ฅ ์ ํตํด Cost ํจ์๋ฅผ ์ป์ ์ ์๋ค. $w_0x_0 + w_1x_1 + โฆ + w_nx_n$ ๊ฐ์ ๊ตฌํ๊ฒ ๋๋ฉด $z$ ๊ฐ์ ์๊ฒ ๋๊ณ $z$์ ๊ฐ์ ์๊ฒ๋๋ฉด ํ๋ฅ $P$์ ๊ฐ์ ์ป์ ์ ์๊ฒ ๋๋ค.
\[\begin{align} &p = \sigma(z) = \frac{1}{1+e^{-z}},\: \frac{p}{1-p} = \frac{\frac{1}{1+e^{-z}}}{\frac{e^{-z}}{1+e^{-z}}} = \frac{1}{e^{-z}} = e^{z} \\ &log_e\frac{p}{1-p} = z \\ &log_e\frac{p}{1-o} = z = w_0x_0 + w_1x_1 + ... + w_nx_n \end{align}\]