第二章 數(shù)據(jù)描述
第一節(jié) 用圖表展示定性數(shù)據(jù)
本節(jié)主要介紹定性數(shù)據(jù)的圖表展示方法。定性數(shù)據(jù)包括分類數(shù)據(jù)和順序數(shù)據(jù),它們的圖表展示方法基本相同。通??梢杂妙l數(shù)分布表和圖形來描述。
一.生成頻數(shù)分布表
定性數(shù)據(jù)本身是對事物的一種分類,因此,只要先把所有的類別都列出來,然后統(tǒng)計出每一類別的頻數(shù),就是一張頻數(shù)分布表。頻數(shù)分布表中落在某一特定類別的數(shù)據(jù)個數(shù)稱為頻數(shù)。頻數(shù)分布包含了很多有用的信息,通過它可以觀察不同類型數(shù)據(jù)的分別情況。
二.定性數(shù)據(jù)的圖形表示
定性數(shù)據(jù)(分類數(shù)據(jù)和順序數(shù)據(jù))可以描繪出它們各類的比例,常用餅圖和條形圖表示。
(一) 餅圖
餅圖又稱圓餅圖、圓形圖等,它是利用圓形及圓內(nèi)扇形面積來表示數(shù)值大小的圖形。餅圖主要用于總體中各組成部分所占比重的研究。
(二) 條形圖
條形圖是用寬度相同的條形的高度或長度來表述數(shù)據(jù)多少的圖形,用于觀察不同類別數(shù)據(jù)的多少或分布情況。繪制時,各類別可以放在縱軸,也可以放在橫軸。
(三) 環(huán)形圖
餅圖只能顯示一個變量(如年齡變量)各部分所占的比重。如果我們想比較不同變量之間的結(jié)構(gòu)差異,就可以通過環(huán)形圖來實現(xiàn)。
首先,利用產(chǎn)生頻數(shù)表的方法先做出分性別的年齡分布表
然后,根據(jù)上表再繪制出環(huán)形圖。
第二節(jié) 用圖表展示定量數(shù)據(jù)
定性數(shù)據(jù)的圖示表示方法,也都適用于定量數(shù)據(jù)。但定量數(shù)據(jù)還有一些特定的圖示方法,它們并不適用于定性數(shù)據(jù)。
一.生成頻數(shù)分別表
生成定量數(shù)據(jù)的頻數(shù)分布表時,首先是將數(shù)據(jù)進(jìn)行分組,然后再統(tǒng)計出各組別的數(shù)據(jù)頻數(shù)即可。
首先,要對數(shù)據(jù)進(jìn)行分組,一般的分組個數(shù)在5—15之間。
其次,要確定組距。所謂組距是指每個組變量值中的最大值與最小值之差。每組最大值稱為該組上限,最小值稱為該組下限。則組距等于上限與下限之差,即
組距=上限-下限
在確定組距是,一般應(yīng)掌握的原則:一是要考慮各組的劃分是否能區(qū)分總體內(nèi)部各個組成部分的性質(zhì)差別。如果不能正確反映各部分質(zhì)的差異,必須重新分組。二是要能準(zhǔn)確地清晰地反映總體單位的分布特征。
在確定組距時,在研究的現(xiàn)象變動比較均勻的情況下,可以采用等距分組;而當(dāng)研究的現(xiàn)象變動很不均勻時,例如急劇的增長或急劇的下降,波動的幅度很大時,則一般采用不等距分組。在實際工作中,要結(jié)合實際情況確定各組的組距。
最后,統(tǒng)計出各組的頻數(shù)及頻數(shù)分布表。在統(tǒng)計各組頻數(shù)時,恰好等于某一組的組限時,則采取上限不在內(nèi)的原則,即將該頻數(shù)計算在與下限相同的組內(nèi)。
二.定量數(shù)據(jù)的圖形表示
常用來表述定量數(shù)據(jù)統(tǒng)計圖形有:直方圖、折線圖和散點圖。
(一) 直方圖
對于一個定量數(shù)據(jù),直方圖是一個常見的而且非常重要的圖形。它的橫坐標(biāo)代表變量分組,縱指標(biāo)代表各變量值出現(xiàn)的頻數(shù),這樣,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖。
(二) 折線圖
折線圖是利用線段的升降來說明現(xiàn)象變動的一種統(tǒng)計圖,它主要用于表示現(xiàn)象的分配情況、現(xiàn)象在時間上的變化和兩個現(xiàn)象之間的依存關(guān)系等。
(三) 散點圖
散點圖能反映兩個變量的關(guān)系,判斷其變化的方向是否相同
應(yīng)特別注意各種圖表的生成方式和運(yùn)用。
第三節(jié) 用統(tǒng)計表來表示數(shù)據(jù)
統(tǒng)計表和統(tǒng)計圖是顯示統(tǒng)計數(shù)據(jù)的兩種方式。在現(xiàn)實生活中,統(tǒng)計表和統(tǒng)計圖形一樣充斥在我們的生活總。它通過對枯燥數(shù)據(jù)的整理,利用一些簡單的表格,讓我們一目了然地了解某些事物的現(xiàn)象。
統(tǒng)計表是一種用密集的形式歸納數(shù)據(jù)的方法,它主要利用行和列中的數(shù)據(jù)來表述現(xiàn)象特征。人們利用統(tǒng)計表的主要目的有:
一是在文章中使用它以支持自己的觀點;二是利用它組織數(shù)據(jù)。
把整理匯總得出的統(tǒng)計數(shù)據(jù)資料,按照一定的結(jié)構(gòu)和順序,有系統(tǒng)地排列在一定的表格內(nèi),就形成一張統(tǒng)計表。
統(tǒng)計表的主要優(yōu)點是:能使統(tǒng)計資料條理化、系統(tǒng)化,能清晰的表達(dá)統(tǒng)計資料的內(nèi)容,且簡明易懂、節(jié)省篇幅,便于對表中資料進(jìn)行對比,并易于檢查數(shù)字的完整性和正確性。
(1) 統(tǒng)計表的結(jié)構(gòu)
統(tǒng)計表一般由五個部分組成,即表頭、行標(biāo)題、列標(biāo)題、數(shù)字資料和表外附加構(gòu)成。
①總標(biāo)題:統(tǒng)計表的名稱。簡明扼要,一般放在表格上方中間位置
②橫行標(biāo)題和縱欄標(biāo)題:縱欄:表明標(biāo)志和指標(biāo)的名稱 ,一般置于表格上方;橫行標(biāo)題:表明調(diào)查單位和分組的名稱,一般置于表格左邊。
③統(tǒng)計數(shù)字(指標(biāo)數(shù)值)。主詞欄:表中資料所說明的對象,位于表的左邊;賓詞欄:各種指標(biāo),位于表的右側(cè)。
(2)統(tǒng)計表的種類
①按用途不同分類
a. 調(diào)查表:用來搜集統(tǒng)計資料的表格;
b. 整理表:用于匯總或整理調(diào)查資料,以及表現(xiàn)統(tǒng)計匯總或整理結(jié)果的表格;
c. 分析表:用于對整理所得的統(tǒng)計資料進(jìn)行定量分析的表格。
②按總體分組不同分類
a. 簡單表:對總體未經(jīng)任何分組,僅是簡單地列出統(tǒng)計資料所屬時間或單位的表格。
b. 簡單分組表:對總體僅按一個標(biāo)志進(jìn)行分組的統(tǒng)計表。
c. 復(fù)合分組表:對總體按兩個或兩個以上標(biāo)志進(jìn)行層疊分組。
③按統(tǒng)計資料的時間和空間分類
a. 空間數(shù)列表:指同一時間條件下,不同空間范圍的統(tǒng)計表。它說明在靜態(tài)條件下,客觀社會經(jīng)濟(jì)現(xiàn)象在不同空間范圍的分布狀況。
b. 時間數(shù)列表:指同一空間條件下,不同時間范圍的統(tǒng)計表。它說明在動態(tài)條件下,客觀社會經(jīng)濟(jì)現(xiàn)象發(fā)展變動狀況。
c. 時空結(jié)合表:是同時反映社會經(jīng)濟(jì)現(xiàn)象在不同空間和不同時間內(nèi)的數(shù)量分布的統(tǒng)計表。
(3)統(tǒng)計表的設(shè)計
總的要求:簡練、明確、實用、美觀,便于比較。
①統(tǒng)計表設(shè)計應(yīng)注意事項
a. 統(tǒng)計表應(yīng)設(shè)計成由縱橫交叉線條組成的長方形表格,長與寬之間保持適當(dāng)?shù)谋壤?/p>
b. 線條繪制。表的上下端應(yīng)以粗線繪制,表內(nèi)縱橫線以細(xì)線繪制。表格左右兩端一般不劃線,采用“開口式”。
c. 合計欄的設(shè)置。統(tǒng)計表各縱列若須合計時,一般應(yīng)將合計列在最后一行,各橫行若須要合計時,可將合計列在最前一欄或最后一欄。
d. 欄數(shù)的編號。如果欄數(shù)較多,應(yīng)當(dāng)按順序編號,習(xí)慣上主詞欄以“甲、乙、丙、丁……”為序號,賓詞欄編以(1)、(2)、(3)、(4)……為序號。
②統(tǒng)計表內(nèi)容設(shè)計應(yīng)注意事項
a. 標(biāo)題設(shè)計:標(biāo)題簡明扼要。
b. 指標(biāo)數(shù)值:數(shù)字填寫整齊,對準(zhǔn)位數(shù)。當(dāng)數(shù)字因小可略而不計時,可寫上“0”;當(dāng)缺某項數(shù)字資料時,可用“…”表示;不應(yīng)有數(shù)字時用符號“-”表示。
c. 計量單位:當(dāng)全表只有一種計量單位時,可以把它寫在表頭的右上方。如果表中各欄的指標(biāo)數(shù)值計量單位不同,可以橫行標(biāo)題后添一列計量單位。
d. 注解或資料來源。
第四節(jié) 用數(shù)字來概括數(shù)據(jù)
針對一組數(shù)據(jù)的分布特征,我們可以從兩個方面來考查它:一是該組數(shù)據(jù)的集中趨勢,即該組數(shù)據(jù)的數(shù)值向其中心值的靠攏程度。二是該組數(shù)據(jù)的離散程度,它反映的是該組數(shù)據(jù)的各個數(shù)值遠(yuǎn)離其中心的趨勢和程度。
一.定性數(shù)據(jù)的數(shù)字特征
由于定性數(shù)據(jù)主要是計數(shù),比較簡單,對定性數(shù)據(jù)的集中趨勢常用的方法就是計算比例、百分比、中位數(shù)和眾數(shù)。
中位數(shù)是將總體各單位標(biāo)志值按大小順序排列,處于中間位置的那個數(shù)(如果樣本量為奇數(shù)),或者中間兩個數(shù)目的平均(如果樣本量為偶數(shù))。
眾數(shù)就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值。在定性數(shù)據(jù)中,由于記錄的是頻數(shù),因此眾數(shù)用得多些。
二.定量數(shù)據(jù)的數(shù)字特征
反映定量數(shù)據(jù)特征的統(tǒng)計量常用的有:
反映數(shù)據(jù)集中趨勢的水平度量:平均數(shù)、中位數(shù)、眾數(shù)和分位數(shù)等
反映數(shù)據(jù)離散程度的差異度量:極差、四分位差、標(biāo)準(zhǔn)差和方差
(一) 水平的度量
1. 平均數(shù)
平均數(shù)也稱為均值,是把某一組數(shù)據(jù)進(jìn)行算術(shù)平均,用以表述某一事物的平均水平,它在統(tǒng)計中叫做均值。
簡單平均數(shù):把一個變量的所有觀測值相加再除以觀測值的數(shù)目
加權(quán)平均數(shù):如果原始數(shù)據(jù)為分組數(shù)據(jù),則采用加權(quán)平均數(shù)公式計算,其中的權(quán)數(shù)f為各組的頻數(shù)。
2. 中位數(shù)
數(shù)字按順序排列后,處于中間位置的數(shù)即是。如總位數(shù)為奇數(shù),中間數(shù)即是;若為偶數(shù),則是中間兩位數(shù)的平均值。
3. 眾數(shù)
數(shù)組中出現(xiàn)次數(shù)最多的數(shù)。
4. 用哪個值代表一組數(shù)據(jù)
平均數(shù)、中位數(shù)和眾數(shù)是描述數(shù)據(jù)水平的三個主要統(tǒng)計量,要合理使用則需要了解它們的不同特點和應(yīng)用場合。平均數(shù)易為多數(shù)人理解和接受,實際中用的也較多,但主要缺點是更容易受少數(shù)極端數(shù)值的影響,對于嚴(yán)重偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差。中位數(shù)和眾數(shù)提供的信息不像平均數(shù)那樣多,但它們也有優(yōu)點,比如不受極端值的影響,具有統(tǒng)計上的穩(wěn)健性,當(dāng)數(shù)據(jù)為偏態(tài)分布,特別是偏斜程度較大時,可以考慮選擇中位數(shù)和眾數(shù),這時它們的代表性要比平均數(shù)好。
(二) 差異的度量
對社會經(jīng)濟(jì)現(xiàn)象不僅需要對現(xiàn)象的集中趨勢進(jìn)行分析(平均數(shù)、中位數(shù)、眾數(shù)),而且還需要進(jìn)行差異程度分析即離散程度分析。研究事物現(xiàn)象的差異性,從差異性的事物現(xiàn)象中,尋求解決差異性的一些方法。
1. 極差( Range)
極差又稱全距,是最簡單的離散指標(biāo),它是一組數(shù)據(jù)中的最大值和最小值之差。
計算極差非常簡單,含義也很直觀。但是,它僅僅受最大值和最小值的影響,不能反映一組數(shù)據(jù) 分布的情況,而且它非常容易受數(shù)據(jù)中極端值的影響。因此,它不能準(zhǔn)確地描述數(shù)據(jù)的分散程度。
2. 方差和標(biāo)準(zhǔn)差
為了反映數(shù)據(jù)中的每一個觀察值與平均水平的差異程度就必須引入方程和標(biāo)準(zhǔn)差的概念。
方差:將各個變量值和其均值離差平方的平均數(shù),作為樣本數(shù)據(jù),它反映了樣本中各個觀測值到其均值的平均離散程度。其計算公式為:
標(biāo)準(zhǔn)差是方差的平方根,它與方差相比更具量綱性,而且與變量值的計量單位相同,使用的范圍比方差更廣泛。其計算公式為:
式中是總體標(biāo)準(zhǔn)差,s為樣本標(biāo)準(zhǔn)差??傮w自由度為n,樣本自由度為n-1,兩種有差異,是因為,自由度是指一組數(shù)據(jù)中可以自由取值的個數(shù),當(dāng)樣本數(shù)據(jù)的個數(shù)為 n時,其樣本均值 是確定的,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)不能自由取值。所以,樣本的標(biāo)準(zhǔn)差只能除以n-1 ,而不能除以n .
在一個統(tǒng)計樣本中,其標(biāo)準(zhǔn)差越大,說明它的各個觀測值分布的越分散,它的趨中程度就越差。反之,其標(biāo)準(zhǔn)差越小,說明它的各個觀測值分布的越集中,它的趨中程度就越好。
3. 離散系數(shù)
離散系數(shù)也稱變異系數(shù)、標(biāo)準(zhǔn)差系數(shù),它是將一組數(shù)據(jù)的標(biāo)準(zhǔn)差除以其均值,用來測度數(shù)據(jù)離散程度的相對數(shù)。其計算公式為:
4. 標(biāo)準(zhǔn)分?jǐn)?shù)
標(biāo)準(zhǔn)分?jǐn)?shù)也稱標(biāo)準(zhǔn)化值或Z分?jǐn)?shù),它是變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,用以測定某一個數(shù)據(jù)在該組數(shù)據(jù)中的相對位置。其計算公式為:
標(biāo)準(zhǔn)分?jǐn)?shù)最大的用途是可以把兩組數(shù)據(jù)中的兩個不同均值,不同標(biāo)準(zhǔn)差的數(shù)據(jù)進(jìn)行對比,以判定它們在各組中的位置。見課本P271例題.標(biāo)準(zhǔn)分?jǐn)?shù)對比的兩個數(shù)據(jù)在各自數(shù)組中的相對位置。
凡本站注明“稿件來源:新科教育”的所有圖文音視頻,版權(quán)均屬新科所有,任何媒體、網(wǎng)站或個人未經(jīng)本網(wǎng)協(xié)議授權(quán)不得轉(zhuǎn)或以其他方式復(fù)制發(fā)表。已獲得本站協(xié)議
授權(quán)的媒體、網(wǎng)站,在下載使用時必須注明“稿件來源:新科教育”,違者本站將依法追究責(zé)任。