在統(tǒng)計學(xué)中,最大似然估計,也稱最大概似估計,是用來估計一個概率模型的參數(shù)的一種方法
通俗來講,最大似然估計是利用已知的樣本的結(jié)果,在使用某個模型的基礎(chǔ)上,反推最有可能導(dǎo)致這樣結(jié)果的模型參數(shù)值。定義
給定一個概率分布 ${displaystyle D}?$ ,已知其概率密度函數(shù)(連續(xù)分布)或概率質(zhì)量函數(shù)(離散分布)為 $f_D?$,以及一個分布參數(shù) ${displaystyle heta }?$ ,我們可以從這個分布中抽出一個具有$ {displaystyle n} ?$個值的采樣$ {displaystyle X_{1},X_{2},ldots ,X_{n}}?$,利用${displaystyle f_{D}}?$計算出其似然函數(shù):
? $$lik( heta|x_1,...,Xn)=f_{ heta}(x_1,...x_n)$$
如何理解似然函數(shù)?? $L( heta|x)=f(x| heta)$
上述公式從兩個角度描述了某一事件發(fā)生的情況。該等式兩邊都表示這個事件發(fā)生的概率。
在給定樣本后,我們?nèi)ハ脒@個樣本出現(xiàn)的可能性到底有多大?在統(tǒng)計學(xué)上,我們認為樣本的出現(xiàn)是服從分布函數(shù)的,我們假設(shè)這個分布函數(shù)位$f$,里面含有參數(shù)$ heta$,對于不同的$ heta$,樣本的分布也不一樣。$f(x| heta)$ 就表示子在給定參數(shù)$ heta$的時候,x出現(xiàn)的概率為多少。
$L( heta|x)$則表示,在給定樣本的x的時候,存在哪一個參數(shù)$ heta$使得x出現(xiàn)的可能性最大。等式的意義表示給定一個參數(shù)$ heta$和一個樣本$x$的時候整個事件的可能性多大。
在這種意義上,似然函數(shù)可以理解為條件概率的逆反。在已知某個參數(shù)$ heta$時,事件A會發(fā)生的概率寫作:
? $$P(A| heta)=frac{P(A, heta)}{P( heta)}$$
然后似然函數(shù)是已知$X$對于$ heta$的函數(shù),根據(jù)貝葉斯定理,
? $$P( heta|A)=frac{P(A| heta)P( heta)}{P(A)}$$
如何理解最大似然函數(shù)?最大似然估計:當我們知道總體的概率分布模型的時候,但是不知道概率分布函數(shù)的參數(shù)的情況下,我們用樣本來估計參數(shù)。
簡單來說,就是通過確定分布函數(shù)的參數(shù)是多少的情況下,使得我們抽的當下樣本的概率最大
對于極大似然估計采取的步驟一般為:
寫出似然函數(shù);
如果無法直接求導(dǎo)的話,對似然函數(shù)取對數(shù);
求導(dǎo)數(shù),令導(dǎo)數(shù)為0,得到似然方程;
解似然方程,得到的參數(shù)即為所求;
1.如果假設(shè)條件是獨立同分布,那么似然函數(shù)往往是連乘的形式,這樣子求偏導(dǎo)數(shù),不容易;通過取對數(shù)的形式將連乘變?yōu)榍蠛?/p>
2.概率值是小數(shù),多個連乘的情況下,容易造成下溢
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/19720.html
摘要:將數(shù)據(jù)集中不含缺失值的變量稱為完全變量,數(shù)據(jù)集中含有缺失值的變量稱為不完全變量。這種程序的實施恰當?shù)胤从沉擞捎谌笔е狄鸬牟淮_定性,使得統(tǒng)計推斷有效。 作者:xiaoyu 微信公眾號:Python數(shù)據(jù)科學(xué) 知乎:python數(shù)據(jù)分析師 showImg(https://segmentfault.com/img/remote/1460000015801387?w=1045&h=603);...
閱讀 2807·2021-09-26 10:19
閱讀 2205·2021-09-24 10:27
閱讀 2595·2021-09-01 10:42
閱讀 2369·2019-08-29 16:09
閱讀 2552·2019-08-29 15:17
閱讀 1505·2019-08-29 15:09
閱讀 691·2019-08-29 11:14
閱讀 2382·2019-08-26 13:25