翻譯|使用教程|編輯:況魚(yú)杰|2020-06-28 11:40:51.540|閱讀 1264 次
概述:數(shù)據(jù)的正態(tài)分布遵循鐘形對(duì)稱(chēng)模式。大多數(shù)觀(guān)察值都接近平均值,并且越來(lái)越遠(yuǎn)離平均值的觀(guān)察值也越來(lái)越少。它表明,有一些方法可以解決原始數(shù)據(jù)的瘋狂問(wèn)題。許多情況下的數(shù)據(jù)都遵循正態(tài)分布。但是,要衡量的許多事情都不遵循這種模式。據(jù)說(shuō)它們具有非正態(tài)分布。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門(mén)軟控件火熱銷(xiāo)售中 >>
相關(guān)鏈接:
Minitab Statistical Software是一款無(wú)與倫比的可視化統(tǒng)計(jì)分析軟件,它會(huì)審視當(dāng)前及過(guò)往的數(shù)據(jù),以找出趨勢(shì)并預(yù)測(cè)規(guī)律、發(fā)現(xiàn)變量之間隱藏的關(guān)系、可視化數(shù)據(jù)交互作用并識(shí)別重要因素,從而解答最棘手的問(wèn)題、應(yīng)對(duì)最嚴(yán)峻的難題。
正常數(shù)據(jù)? 非正常數(shù)據(jù)? 在分布中尋找模式
數(shù)據(jù)的正態(tài)分布遵循鐘形對(duì)稱(chēng)模式。大多數(shù)觀(guān)察值都接近平均值,并且越來(lái)越遠(yuǎn)離平均值的觀(guān)察值也越來(lái)越少。它表明,有一些方法可以解決原始數(shù)據(jù)的瘋狂問(wèn)題。許多情況下的數(shù)據(jù)都遵循正態(tài)分布。但是,要衡量的許多事情都不遵循這種模式。據(jù)說(shuō)它們具有非正態(tài)分布。
但是,對(duì)于正態(tài)和非正態(tài)數(shù)據(jù),如果我們從總體中重復(fù)獲取大小為n的獨(dú)立隨機(jī)樣本,則當(dāng)n大時(shí),樣本均值的分布將接近正態(tài)分布。
多大的樣本量就足夠了?
這要看情況。總體分布已經(jīng)越接近于正態(tài)分布,證明該定理所需的樣本就越少。一般來(lái)說(shuō),樣本大小為30或更大被認(rèn)為足以使中心極限定理生效。 但是,嚴(yán)重偏斜或具有多種模式的總體可能需要更大的樣本量。
示例1:滾動(dòng)模具顯示正態(tài)分布
假設(shè)您有一個(gè)6面模具。滾動(dòng)任何數(shù)字的概率為1/6。滾動(dòng)任何一個(gè)數(shù)字的概率與滾動(dòng)其他五個(gè)數(shù)字的概率相同。在Minitab統(tǒng)計(jì)軟件中,您可以利用隨機(jī)數(shù)據(jù)生成器為您的第一卷模具模擬500種不同的結(jié)果。 單擊計(jì)算>隨機(jī)數(shù)據(jù)>整數(shù)…,并使其生成500行,其中最小值為1,最大值為6。
直方圖可用于可視化這500個(gè)“第一卷”。 在這種情況下,樣本大小為1。并且由于滾動(dòng)每個(gè)數(shù)字的幾率相等,因此分布相對(duì)平坦。請(qǐng)看下圖中的藍(lán)色條形圖與代表正態(tài)分布的紅色曲線(xiàn)圖相比如何? 這不正常。
現(xiàn)在,讓我們獲取更多樣本,看看這些樣本的平均值的直方圖發(fā)生了什么。這次,將模擬模子滾動(dòng)兩次,并重復(fù)此過(guò)程500次。現(xiàn)在樣本大小為2。我們使用Calc> Row Statistics…計(jì)算每對(duì)的平均值。見(jiàn)下文。在這里,每一行代表大小為2的樣本及其均值。 當(dāng)樣本量足夠大時(shí),將遵循正態(tài)分布。讓我們創(chuàng)建一個(gè)獲取想法的直方圖。它開(kāi)始看起來(lái)更加正常。現(xiàn)在,讓我們擲骰子5、10、20和30次。
每組均值的直方圖顯示,隨著樣本數(shù)量的增加,樣本均值的分布越來(lái)越接近正態(tài)分布。
示例2:指數(shù)分布
指數(shù)分布模擬事件之間的時(shí)間。無(wú)論產(chǎn)品是全新的,一年或更舊的(無(wú)論是全新的還是一歲的),它都是隨時(shí)可能發(fā)生故障的產(chǎn)品或產(chǎn)品生命周期的一個(gè)很好的模型。它開(kāi)始老化并在預(yù)期的應(yīng)用中磨損。這是估算晶體管失效時(shí)間的概率密度曲線(xiàn)的示例。
顯然,這不是正態(tài)分布。但是,當(dāng)您使用樣本量5生成指數(shù)數(shù)據(jù)時(shí),計(jì)算均值,然后創(chuàng)建均值的直方圖會(huì)怎樣?樣本量10、20和30怎么樣?
就像滾動(dòng)模具一樣,隨著樣本數(shù)量的增加,均值的分布更接近正態(tài)分布。
如果您感興趣,可以下載Minitab來(lái)試試!當(dāng)然,你有任何其他想了解的信息,可以點(diǎn)擊咨詢(xún)在線(xiàn)客服>>
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn
文章轉(zhuǎn)載自:minitab