您當前的位置:首頁 > 曲藝

Stata:資料匯入及整理

作者:由 大多不識字 發表于 曲藝時間:2021-11-08

一、面板資料整理

(一)面板資料的意思:

面板資料是指涉及“時間、地點、人物”三要素的立體資料,也即截面資料與時間序列資料的混合版本。簡而言之:“眾多主體中的【某個主體】,在時間序列中的【某個時間點】,對應著眾多變數指標中的【某個指標】,的那個數值(賦值)是什麼。”

(二)面板資料的基本格式:

小白入門,可以先用Excel把資料搞好了再導進去Stata進行實證。假設,該資料有2個主體,年份一共3年,一共有3個變數指標,則面板資料在Excel中的排列格式如下:

Stata:資料匯入及整理

若有N個主體,有T個年份,有n個指標,則按上述表格類推出去,形成一個N*T*n的平面資料集。

(三)面板資料的分類:

1、短面板和長面板:若T較大而N較小,則為長面板資料,反之則為短面板資料。

2、靜態面板和動態面板:如果解釋變數中包含著被解釋變數的滯後項,則稱為“動態面板”,反之則稱為“靜態面板”。

3、平衡面板和非平衡面板:若每個時期中,樣本的個體都完全一樣,則稱為“平衡面板資料”,反之為“非平衡面板資料”。(即:每個個體的每個時間的每個指標都不缺失,是一個完完整整的N*T*n資料集,則平衡)

二、面板資料的Stata整理(以Stata/SE 16。0為例)

(一)匯入Stata:

1、開啟Stata—Stata基礎頁面—檔案—匯入—Excel電子表格

2、點選“瀏覽”—選擇整理好資料的Excel表格“Stata示範資料。xlsx“—勾選“將第一行作為變數名”—點選“確定”

(二)檢視資料:

Stata基礎頁面—資料—資料編輯器—資料編輯器(編輯)(在這裡可以看到所有資料,以及自由編輯各指標的名稱、資料型別以及格式等等。)

(三)整理資料:

1、若發現某個指標的資料顯示為紅色,需要更改該指標的資料型別。

(1)命令:*encode var1, gen(var1_new)

(假設這個指標是“var1”,用*encode命令處理後重新命名為“var1_new”)

2、將資料集命令為面板資料:

(1)命令:*xtset id time(id為主體序列名稱,time為時間序列名稱)

(2)返回結果如下:

。 xtset id year

panel variable: id (unbalanced)

time variable: year, 2005 to 2018

delta: 1 unit

(3)理解:unbalanced說明該面板為非平衡面板

至此,資料的匯入和整理已經結束了。再次檢查“資料編輯器”,所有資料均無紅標。之後就開始進行實證檢驗了。

三、資料的描述性統計表

(一)常用命令:

1、*summarize var1…var_n(該命令返回各變數的樣本量、均值、標準差、最小值與最大值。)

2、*sum var1…var_n, detail(該命令返回更詳盡的描述性統計結果;*sum為*summarize的縮寫

------------分---界---線------------

下面是這一專欄的開篇,誠邀有緣的畫師一起來畫貓。

以上。

標簽: 面板  資料  stata  VAR1  指標