第一章 統(tǒng)計和數據
第一節(jié) 統(tǒng)計學的含義
一.什么是統(tǒng)計學
統(tǒng)計學是一門研究數據的科學,按大百科全書的定義:統(tǒng)計學是用以收集數據,分析數據和由數據得出結論的一組概念、原則和方法。
統(tǒng)計分析數據分兩種:描述統(tǒng)計和推斷統(tǒng)計
描述統(tǒng)計是研究數據搜集、處理和描述的統(tǒng)計學方法。其內容 包括如何取得研究所需要的數據,如何用圖表形式對數據進行處理和展示,如何通過對數據的綜合、概括與分析,得出所關心的數據特征。
統(tǒng)計描述是指對由實驗或調查而得到的數據進行登記、審核、整理、歸類、計算出各種能反映總體數量特征的綜合指標,并加以分析,從中抽出有用的信息,用表格或圖像把它表示出來。是統(tǒng)計研究的基礎。它通過對分散無序的原始資料的整理歸納,運用分組法和綜合指標法得到現象總體的數量特征,揭露客觀事物內在數量規(guī)律性,達到認識的目的。
分組法是研究總體內部差異的重要方法,通過分組可以研究總體中不同類型的性質以及它們的分布情況
綜合指標法是指運用各種統(tǒng)計指標來反映和研究客觀總體現象的一般數量特征和數量關系的方法
統(tǒng)計模型法是綜合指標法的擴展。它是根據一定的理論和假定條件,用數學方程去模擬現實客觀現象相互關系的一種研究方法。
推斷統(tǒng)計則是研究如何利用樣本數據來推斷總體特征的統(tǒng)計學方法,內容包括參數估計和假設檢驗兩大類。
所謂統(tǒng)計推斷就是以一定的置信標準要求,根據樣本數據來判斷總體數量特征的歸納推理的方法。統(tǒng)計推斷是邏輯歸納法在統(tǒng)計推理的應用,所以稱為歸納推理的方法。
(1)參數估計法:當總體的界限已劃定,總體某一數量特征(如總體平均數、方差等)的數值就是唯一確定的,所以把總體的數量特征稱為總體參數。但是總體參數通常不知道,這就需要通過樣本數據計算樣本統(tǒng)計量,并以此作為總體參數的估計量來估計總體參數的取值或取值區(qū)間,這種方法稱之為參數估計法。
(2)假設檢驗法:假設檢驗的特點是,由于對總體的變化情況不了解,不妨先對總體的狀況作某種假設,然后根據樣本實際觀察的資料對所作假設進行檢驗,來判斷這種假設的真?zhèn)?,以決定行動的取舍。假設檢驗的方法是統(tǒng)計推斷常用的方法。
二.統(tǒng)計的應用
(一)統(tǒng)計的應用領域
統(tǒng)計是適用于所有學科領域的通用數據分析方法,是一種通用的數據分析語言。
(二)統(tǒng)計的誤用與濫用
統(tǒng)計常常被人們有意或無意地濫用。如,錯誤的統(tǒng)計定義、錯誤的圖表提示、一個不合理的樣本、數據的遺漏或邏輯錯誤等。這些誤用有些是常識性的,有些是技術性的,有些則是故意的。作為從數據中尋找事實的統(tǒng)計,卻被有人變成了歪曲事實的工具。
第二節(jié) 數據類型
統(tǒng)計數據是對客觀現象特征的反映,而由于客觀現象的復雜性,在反映這些現象特征時,可以從不同的角度進行采集,從而得到不同類型的數據。
一.變量與數據
變數或變量,是指沒有固定的值,可以改變的數。變量的具體數值稱為變量值,即數據。統(tǒng)計數據就是統(tǒng)計變量的具體表現。
二.數據類型
(一)定性變量(數據)與定量變量(數據)
1.定性變量:反映“職業(yè)”、“教育程度”等現象的屬性特點的變量,不能說明具體量的大小和差異。
分類變量:沒有量的特征,只有分類特征。這種只反映現象分類特征的變量又稱分類變量。分類變量的觀測結果就是分類數據。說明事物類別的一個名稱。如“性別”就是一個分類變量。
順序變量:如果類別具有一定的順序,如,“教育類別”,這樣的變量稱為順序變量,相應的觀察結果就是順序數據。說明事物有序類別的一個名稱,這類變量的具體表現就是順序數據。
2.數值(定量)變量:反映“天氣溫度”、“月收入”等變量可以用數值表示其觀察結果,而且這些數值具有明確的數值含義,不僅能分類而且能測量出來具體大小和差異。這些變量就是定量變量也稱數值變量,定量變量的觀察結果成為定量數據。說明事物數字特征的一個名稱。
分類變量沒有數值特征,所以不能對其數據進行數學運算。分類數據只能用來區(qū)分事物,而不能用來表明實物之間的大小、優(yōu)劣關系。
順序變量比分類變量向前進一步,它不僅能用來區(qū)分客觀現象的不同類別,而且還可以表明現象之間的大小、高低、優(yōu)劣關系。顯然,順序數據的功能比分類數據要強一些,對事物的劃分也更精細一些。但順序數據的數據之間雖然可以比較大小,卻無法計算相互之間的大小、高低或優(yōu)劣的距離。只是反映事物在性質上的差異,而不能用來反映事物在數量上的差異。因此,從本質上,順序數據仍然是定性數據中的一種。
數值型數據作為統(tǒng)計研究的主要資料,其特征在于它們都是以數值的形式出現的,有些數值型數據只可以計算數據之間的絕對差,而有些數值型數據不僅可以計算數據之間的絕對差,還可以計算數據之間的相對差。其計量精度遠遠高于定性數據。在統(tǒng)計學研究中,對數值型數據的研究是定量分析的主要內容。
從上述三種數據的基本特點可以看出,這三類數據對事物的描述是由定性到定量、由低級到高級,從粗略到精細。在統(tǒng)計研究中,需要明確各種數據所適用的統(tǒng)計方法,正確的選擇和應用,這是正確進行統(tǒng)計研究的基本要求。
(二)觀測數據和實驗數據
按獲取數據的方法不同,可分為觀測數據和實驗數據。觀測數據可能是全面數據也可能是樣本數據(局部),實驗數據一般都是樣本數據。
1. 觀測數據。
觀測數據是對客觀現象進行實地觀測所取得的數據,在數據取得的過程中一般沒有認為的控制和條件約束。在社會經濟問題研究中,觀測是取得數據最主要的方法。
2. 實驗數據。
實驗數據一般是在科學實驗環(huán)境下取得的數據。在實驗中,實驗環(huán)境是受到嚴格控制的,數據的產生一定是某一約束條件下的結果。在自然科學研究中實驗的方法應用非常普遍。
第三節(jié) 數據來源與搜集數據的方法
一.數據的來源
從使用者的角度看,統(tǒng)計數據資料的來源主要有兩種渠道:一種是通過直接的調查或實驗獲得的原始數據,這是統(tǒng)計數據的直接來源,一般稱為原始或第一手統(tǒng)計數據;另一種是別人調查的數據,并將這些數據進行加工和匯總后公布的數據,通常稱為次級數據或第二手間接的統(tǒng)計數據。一切間接的統(tǒng)計數據都是從原始的、第一手數據過渡而來的。
(一) 數據的直接來源——原始數據
搜集數據最基本的形式就是進行統(tǒng)計調查或進行實驗活動,統(tǒng)計調查或進行實驗就是統(tǒng)計數據的直接來源。
1. 統(tǒng)計調查
統(tǒng)計調查是指根據統(tǒng)計研究預定的目的、要求和任務,運用科學的方法,有計劃、有組織地向客觀實際搜集資料的過程。通過統(tǒng)計調查得到的數據,一般稱為觀測數據。
2. 實驗法
實驗法是直接獲得統(tǒng)計數據的又一重要來源。通過實驗法得到的數據就是實驗數據。
實驗法不僅是一種搜集數據的方式,也是一種重要的研究方式。它是通過有意識地改變或控制某些輸入變量,觀察其他輸出變量的變化,從而達到對事物本質或相互聯(lián)系的認識。未來觀察對輸入變量的控制是否導致了輸出變量的改變,在實驗中,往往需要將研究對象分為兩個組,一個是實驗組,一個是對照組,對實驗組的輸入變量加以控制或改變,而對照組則不加控制,根據兩組的輸出結果,可以看到輸入變量對輸出變量的影響。
運用實驗法要注意的是:首先,實驗組和對照組的產生應當是隨機的,研究對象的不同單位應當被隨機地分配到實驗組或對照組,而不應是經過有意識的挑選的。其次,實驗組和對照組還應當匹配的,也就是研究對象的背景資料應當是大體相同的,至少不要差異太大。
不論是統(tǒng)計調查還是實驗,所搜集的數據都是原始數據,這是統(tǒng)計數據最基本的來源。
(二)數據的間接來源——次級數據
雖然統(tǒng)計數據的搜集主要是指對原始數據的搜集,后面介紹的統(tǒng)計調查的方法也是圍繞搜集原始資料展開的,但數據的收集實際上不僅包括對原始數據的收集也包括對次級數據(第二手收據)的收集,在很多情況下,統(tǒng)計研究都是在掌握次級數據的基礎上進行的。
次級數據是指由其他人搜集和整理得到的統(tǒng)計數據。這種來自他人調查整理基礎上的數據我們把它稱為數據的間接來源。
數據的間接來源有:(1)公開出版的統(tǒng)計數據,主要來自官方的統(tǒng)計部門和政府、組織、學校、科研機構。(2)尚未公開發(fā)表的統(tǒng)計數據,如各企業(yè)的經營報表數據、專業(yè)調查咨詢機構為公開發(fā)布的調查結果數據。需注意的是,如果公開引用未公開發(fā)表的數據需要征得數據所有者的同意,同時要為自己發(fā)布的數據負責。
恰當地運用間接數據在實際中往往能夠節(jié)約時間和費用,取得較好的成果和效益,因此,成為許多統(tǒng)計研究人員在進行實證分析時的首選數據來源。但在應用時要注意:(1)是否了解并正確理解了間接數據中變量的含義、計算口徑、計算方法,以防止誤用、錯用他人的數據。(2)引用間接數據時要注明數據來源,尊重他人的勞動成果和知識產權。
二.搜集數據的方法
統(tǒng)計調查是根據調查的目的與要求,運用科學的調查方法,有計劃、有組織第搜集統(tǒng)計數據資料的過程。常用的統(tǒng)計調查種類有:
(一) 普查
普查:普查是專門組織一次性的全面調查,用來調查屬于一定時點或時期內的社會經濟現象的總量。它適用于搜集某些不能或不適宜于定期的全面統(tǒng)計報表搜集的統(tǒng)計資料,以摸清重大的國情、國力。如,人口普查、農業(yè)普查、經濟普查、全國第三產業(yè)普查等。
普查的特點:它是一種全面調查,具有資料包括范圍全面、詳盡、系統(tǒng)的優(yōu)點;它是一次性的專門調查,因為普查的工作量大,耗資也多,時間周期較長,一般不宜經常舉行。
普查要遵循以下幾點:
a.確定普查的標準時間:普查的標準時間是指登記調查單位項目所依據的統(tǒng)計時點。所有的調查資料都必須是反映這一時點上的情況。例如,我國第四人口普查,1990年7月1日零時為普查登記的標準時點。凡是在這個時點以前死亡和這個時點以后出生的,都不能計入這次普查的人口數內。這樣才可避免所登記重復或遺漏。
b.普查的登記工作應在整個普查范圍內同時進行,以保證普查資料的實效性、準確性,避免資料的搜集工作拖的太久
c.同類普查的內容和時間在歷次普查中應盡可能保持連貫性。普查的組織形式有兩種:一種是組織專門的普查機構,派專門的調查人員對被調查單位直接進行登記;另一種是利用一定的組織系統(tǒng),由被調查單位根據本單位的原始記錄和實際情況,填寫調查表,然后上報。
(二) 抽樣調查
抽樣調查:抽樣調查是按隨機原則,從總體中抽取一部分單位作為樣本來進行觀察,并根據其觀察的結果來推斷總體數量特征的一種非全面調查方法。
抽樣調查具有的特點:第一,樣本單位按隨機原則抽取,排除了主觀因素對選取樣本單位的影響。第二,能夠根據部分調查的實際資料對調查對象的總體的數量特征進行推斷,從而達到對調查總體的認識。第三,在抽樣調查中會存在抽樣誤差,但是這個誤差可以事先計算并加以控制。
隨機抽樣一般是指每個總體單位都有同等被抽中的機會,但是在實際調查中,并不完全是這種情況。通常采用的抽樣組織形式主要有以下幾種:
a.簡單隨機抽樣:又稱純隨機抽樣,它是指對總體不作任何處理,不進行分類也不進行排除,而是完全按隨機的原則,直接從總體中抽取樣本單位加以觀察。從理論上說,是最符合抽樣調查的隨機原則,是抽樣調查的最基本形式。具體方法有:直接抽選法、抽簽法和隨機數表法。
b.分層抽樣:又稱類型抽樣或分類抽樣。是先將總體各單位按主要標志加以分層,而后在各層中按隨機的原則抽取若干樣本單位,由各層的樣本單位組成一個樣本。
c.等距抽樣:又稱機械抽樣或系統(tǒng)抽樣。它是將總體全部單位按某一標志排隊,而后按固定的順序和相等間隔在總體中抽取若干樣本單位,構成一個容量為n的樣本。
d.整群抽樣:是將總體各單位劃分為若干群,然后以群為單元,從總體中隨機抽取一部分群,對被抽中的群內所有單位進行全面調查。整群抽樣對總體劃分群的基本要求是:第一,群與群之間不重疊,即總體中的任一單位只能屬于某個群;第二,全部總體單位毫無遺漏,即總體中的任一單位必須屬于某個群。
e.多階段抽樣:當總體很大時,可把抽樣過程分成幾個過渡階段,到最后才具體抽到樣本單位。
(三) 統(tǒng)計報表
統(tǒng)計報表制度:它是按照國家統(tǒng)一規(guī)定的調查要求與文件(指標、表格形式、計算方法等)自下而上的提供統(tǒng)計資料的一種報表制度。在官方統(tǒng)計的經常調查中目前依然發(fā)揮著一定的作用。
按照報送范圍,統(tǒng)計報表分為全面報表和非全面報表。
按報送周期,統(tǒng)計報表主要有月報、季報、年報組成,月報內容簡單,時效性強,年報則內容比較全面。
統(tǒng)計報表的內容包括表式和填表說明。
對于大型、國有企業(yè)來說,利用統(tǒng)計報表搜集數據,具有時間快、成本低的優(yōu)點,但對于大量的小型、非國有經濟單位,則難以全面采用統(tǒng)計報表調查。
(四) 重點調查
重點調查:是一種非全面調查,它是在調查對象中選擇一部分對全局具有決定性作用的重點單位進行調查。適用于調查任務只要求掌握調查總體的基本情況,調查標志比較單一,調查標志表現在數量上集中于少數單位,而這些少數單位的標志值之和在總體中又占絕對優(yōu)勢的情況。
重點調查組織方式有兩種:一是專門組織的一次性調查;另一種是利用定期統(tǒng)計報表經常性地對一些重點單位進行調查。其優(yōu)點是花費較少人力、物力,在較少時間內及時取得有關的基本情況。
(五) 典型調查
典型調查:根據調查的目的與要求,在對被調查對象進行全面分析的基礎上,有意識地選擇若干具有典型意義的或有代表性的單位進行調查,主要作用是:第一,補充全面調查的不足;第二,在一定條件下可以驗證全面調查數據的真實性。
其優(yōu)點是靈活機動、通過少數典型即可取得深入詳實的統(tǒng)計資料,缺點是受“有意識地選出若干有代表性”的限制,易受人們主觀認識上的影響,必須同其他調查結合起來使用,才能避免出現片面性。
表一 各類統(tǒng)計調查方法的特點
|
|
調查范圍 |
調查時間 |
收集資料的方法 |
普查 |
全面 |
一次 |
采訪、報告或空間遙感 |
抽樣調查 |
非全面 |
經常或一次 |
直接觀察或采訪 |
統(tǒng)計報表 |
全面或非全面 |
經常 |
報告 |
重點調查 |
非全面 |
經?;蛞淮?/td>
| 報告 |
典型調查 |
非全面 |
一次 |
采訪 |
凡本站注明“稿件來源:新科教育”的所有圖文音視頻,版權均屬新科所有,任何媒體、網站或個人未經本網協(xié)議授權不得轉或以其他方式復制發(fā)表。已獲得本站協(xié)議
授權的媒體、網站,在下載使用時必須注明“稿件來源:新科教育”,違者本站將依法追究責任。