一、統計分布的概念
1、概念:(識記)統計分布又稱次數分布,也稱分配數列。
是在分組基礎上,將總體的所有單位按組進行歸并排列,形成總體中各個單位在各組間的分布。
統計分布的實質是把總體的全部單位按某標志所分得組進行分配所形成的數列。
2、統計分布的2要素:
(1)總體按某標志所分的組。
(2)各組的單位數(次數)。
3、統計分布的種類:(識記)
(1)對稱分布:集中位置在中間,左右兩側頻數大體對稱。
(2)偏態(tài)分布:集中位置偏向一側,左右兩側頻數不對稱。
4、(識記)分配數列分為品質分配數列(按品質標志分組)和變量分配數列。
變量數列分為單項式數列和組距式數列。組距式數列又分為等距式分組和不等距式分組,還可以分為開口式分組和閉口式分組。
對離散型變量數列,如果變量值數目不多,則可編成單項式;如果變量值數目很多,則應編成組距式。連續(xù)型變量數列一般是組距式的。
【2011判斷】對于變量值數目很少的離散變量數列應以組距式而非單項式進行編制。()
【答案】×
【例單選】分配數列包含兩個組成要素,即()。
A、分組標志和組距
B、分組和次數
C、分組標志和次數
D、分組和表式
【答案】B
三、組距式變量數列編制的基本概念
(一)組距和組數
(識記)組距:是指每個組變量值中最大值與最小值之差。即組距=組上線-組下限。
組上線:每組變量值中的最大值。
組下限:每組變量值中的最小值。
(識記)組數:組距式變量數列編制過程中分組個數。組數與組距成反比關系。
同一變量數列中,組數越多,則組距越小;反之,組數越小,則組距越大。
【2011單選】組距的正確計算公式是()。
A、組距=上限-下限
B、組距=下限-上限
C、組距=(上限-下限)∕2
D、組距=(上限+下限)∕2
【答案】A
【2012判斷】在同一變量數列中,組數越多,則組距越大;反之,組數越少,則組距越小,兩者成正比關系。()
【答案】×
確定組數和組距應遵循的原則:
1、能區(qū)分總體內部各個組成部分的性質差別。
2、能準確清晰反映總體單位的分布特征。
(二)等距與不等距數列
(識記)等距數列:各組組距相等的數列。
(識記)異距數列:各組組距不完全相等的數列。
等距分組:標志值的變動幅度在各組之間相等的分組。對總體單位標志值變動比較均勻的情況下,可以采用等距分組。
不等組分組:標志值的變動幅度在各組之間不相等的分組。當總體單位標志值很不均勻,波動較大時應采用不等距分組。
在不等距分組中,如果標志值是按一定比例發(fā)展變化的,可以按等比例的組距分組,但更多的情況下采用不等距分組。如研究人口總體在人生各發(fā)展階段的分布。
【2009單選】組距數列中的等距數列是指()。
A、各組次數相等的數列
B、各組組中值相等的數列
C、各組組距相等的數列
D、各組頻率相等的數列
【答案】C
(三)組距與組中值
(識記)組限是指每個組的兩端標志值,每一組的起點值為下限(或最小值),終點值為上限(或最大值)。每個組上限與下限的中點值叫組中值,
即:組中值=(上限+下限)÷2
劃分組限時,相鄰組的上下限可以不重疊,也可以重疊。在后一種情況,與上限相等的標志值應該計入下一組,即“上限不在組內”。
首組開口組的下限=首組上限—鄰組組距
末組開口的上限=末組下限+鄰組組距
首組開口組的組中值=首組上限—鄰組組距÷2
末組開口組的組中值=末組上限+鄰組組距÷2
組中值是代表各組標志值平均水平的數值,當各組內標志值均勻分布時,可以用組中值代表各組標志值平均水平,但各組標志值不是均勻分布時,組中值只能近似代替各組實際平均值。
(簡單應用)開口組組中值的計算:
首組開口的“虛擬”組下限=首組上限-鄰組組距
組中值=上限-鄰組組距/2
末組開口的“虛擬”組上限=末組下限+鄰組組距
組中值=下限+鄰組組距/2
【2012單選】開口組中末組的組中值等于()。
A、末組下限+鄰組組距/2
B、末組下限-鄰組組距/2
C、末組上限+鄰組組距/2
D、末組上限-鄰組組距/2
【答案】A
【2010多選】在組距數列中,關于組中值的表述,下列選項正確的有()。
A、是上限和下限之間的中點數值
B、在開口組中,可以參考相鄰組的組距來確定
C、是該組的上限
D、在開口組中無法確定
E、當各組內標志值均勻分布時,用來代表各組標志值的平均水平
【答案】ABE
【2009單選】某等距連續(xù)變量數列,其末組為開口組,下限為200,又知其鄰組的組中值為60,則末組組中值為()。
A、260
B、215
C、230
D、285
【答案】C
(四)頻數與頻率
1、頻數
(識記)頻數是指分配數列中各組的單位數,也稱次數。頻數越大,該組的標志值對總體標志水平所起的作用越大;反之越小。頻數實際上是各組標志值的權數,用以權衡各組作用的大小。
【2011單選】頻數是指分配數列中各組的()。
A、總體數
B、單位數
C、指標數
D、標志數
【答案】B
2、頻率
(識記)頻率是將各組的單位數(頻數)與總體單位數相比,求得的百分比表示的相對數,也稱比率、比重或權重。頻率實際上是各組標志值在整個分組中的權重,用以權衡各組作用大小。
各組的頻率均大于0,各組的頻率總和等于1。
累計頻數:累計出到本組為止的各組頻數。
累計頻率:累計頻數除以頻數總和。
四、統計分布的表示方法
(識記)統計分布的表示方法主要有列表法和圖示法。
(一)列表法
(識記)將統計分布以統計表的形式表示出來。
(二)圖示法
在列表法的基礎上,繪制分布圖來表示統計分布,以便更直觀地顯示統計分布的特征。
1、直方圖
(領會)直方圖的每個條形的寬度表示組距寬度,高度表示各組頻數或頻率。
直方圖中每個條形的面積與所有條形面積和之比反映了各組的頻率。
【2011單選】直方圖中每個條形的面積與所有條形面積和之比為()。
A、頻數B、頻次
C、頻度D、頻率
【答案】D
【2010判斷】直方圖的每個條形的寬度表示各組頻數或頻率,高度表示組距寬度。()
【答案】×
2、折線圖
(識記)折線圖是依次連接各組組中值上方的高度等于頻數或者頻率的點而成的圖形。
3、曲線圖
(識記)統計分布的曲線圖中使用頻率最高的一種曲線叫正態(tài)分布曲線:“兩頭小、中間大”,所描述的統計分布具有以下特征:以標志變量的平均值為中心,沿對稱軸向兩邊發(fā)展,越接近中心,分配的次數越多,離中心越遠,分配的次數越少。
【2012單選】正態(tài)分布是使用頻率最高的一種統計分布,但有些現象不符合正態(tài)分布。下列現象中最可能不符合正態(tài)分布的是()。
A、人的身高
B、人的體重
C、居民收入
D、學生考試成績
【答案】C
4、餅圖
(識記)餅圖用來反映各組頻數所占的比例,一般用百分比表示。
凡本站注明“稿件來源:新科教育”的所有圖文音視頻,版權均屬新科所有,任何媒體、網站或個人未經本網協議授權不得轉或以其他方式復制發(fā)表。已獲得本站協議
授權的媒體、網站,在下載使用時必須注明“稿件來源:新科教育”,違者本站將依法追究責任。