閱讀275 返回首頁    go 阿裏雲 go 技術社區[雲棲]


C++內存管理學習筆記(3)

/****************************************************************/

/*            學習是合作和分享式的!

/* Author:Atlas                    Email:wdzxl198@163.com   

/*  轉載請注明本文出處:

*   https://blog.csdn.net/wdzxl198/article/details/9078965

/****************************************************************/

以前學習筆記內容回顧:得意傳送門,傳送門2.

1.C++內存管理

1.1c語言和C++內存分配

1.2區分堆、棧、靜態存儲區

1.3控製C++的內存分配

1.4內存管理的基本要求

1.5常見的內存錯誤及對策


1.6指針與數組

       C/C++中對數組和指針的掌握是程序員基本的技術功底,對於數組和指針的定義、操作、它們間的區別等內容,詳見我另一篇文章《C/C++數組和指針詳解》

這裏以學習《c++內存管理技術內幕》為主,對其中的疑點,不明白或者沒有說明清楚的地方會在學習筆記中講解說明,需要特殊講解的會發單獨的文章。

       C++/C程序中,指針和數組在不少地方可以相互替換著用,讓人產生一種錯覺,以為兩者是等價的。

數組要麼在靜態存儲區被創建(如全局數組),要麼在棧上被創建。<-------這句話說的不恰當!當數組通過new或者malloc創建是,數組內容是在堆中,如果有指針指向這個數組,則這個指針是在棧中。其他情況可以說是要麼在靜態區創建,或者在棧上申請。

       數組名對應著(而不是指向)一塊內存,其地址與容量在生命期內保持不變,隻有數組的內容可以改變。指針可以隨時指向任意類型的內存塊,它的特征是“可變”,所以我們常用指針來操作動態內存。指針遠比數組靈活,但也更危險。

下麵以字符串為例比較指針與數組的特性。

(1)修改內容的方式

        下麵示例中,字符數組a的容量是6個字符,其內容為hello。a的內容可以改變,如a[0]= ‘X’。指針p指向常量字符串“world”(位於靜態存儲區,內容為world),常量字符串的內容是不可以被修改的。從語法上看,編譯器並不覺得語句p[0]= ‘X’有什麼不妥,但是該語句企圖修改常量字符串的內容而導致運行錯誤。

   1: char a[] = “hello”;
   2: a[0] = ‘X’;
   3: cout << a << endl;
   4: char *p = “world”; // 注意p指向常量字符串
   5: p[0] = ‘X’; // 編譯器不能發現該錯誤
   6: cout << p << endl;

(2)複製內容以及內容比較的方式

       不能對數組名進行直接複製與比較。若想把數組a的內容複製給數組b,不能用語句 b = a ,否則將產生編譯錯誤。應該用標準庫函數strcpy進行複製。同理,比較b和a的內容是否相同,不能用if(b==a) 來判斷,應該用標準庫函數strcmp進行比較。

       語句p = a 並不能把a的內容複製指針p,而是把a的地址賦給了p。要想複製a的內容,可以先用庫函數malloc為p申請一塊容量為strlen(a)+1個字符的內存,再用strcpy進行字符串複製。同理,語句if(p==a) 比較的不是內容而是地址,應該用庫函數strcmp來比較。

   1: // 數組…
   2: char a[] = "hello";
   3: char b[10];
   4: strcpy(b, a); // 不能用 b = a;
   5: if(strcmp(b, a) == 0) // 不能用 if (b == a)
   6:
   7:  
   8: // 指針…
   9: int len = strlen(a);
  10: char *p = (char *)malloc(sizeof(char)*(len+1));
  11: strcpy(p,a); // 不要用 p = a;
  12: if(strcmp(p, a) == 0) // 不要用 if (p == a)
  13:

(3)計算內存容量

         用運算符sizeof可以計算出數組的容量(字節數)。如下示例中,sizeof(a)的值是12(注意別忘了’’)。指針p指向a,但是sizeof(p)的值卻是4。這是因為sizeof(p)得到的是一個指針變量的字節數,相當於sizeof(char*),而不是p所指的內存容量。C++/C語言沒有辦法知道指針所指的內存容量,除非在申請內存時記住它。

   1: char a[] = "hello world";
   2: char *p = a;
   3: cout<< sizeof(a) << endl; //12Bytes
   4: cout<< sizeof(a) << endl; //4 Bytes

注意當數組作為函數的參數進行傳遞時,該數組自動退化為同類型的指針。如下示例中,不論數組a的容量是多少,sizeof(a)始終等於sizeof(char *)。

   1: void Func(char a[100])
   2: {
   3:     cout<< sizeof(a) << endl; // 4Bytes,not 100Bytes
   4: }

1.7指針參數是如何傳遞內存?

      如果函數的參數是一個指針,不要指望用該指針去申請動態內存。如下示例中,Test函數的語句GetMemory(str, 200)並沒有使str獲得期望的內存,str依舊是NULL,為什麼?

   1: void GetMemory(char *p, int num)
   2: {
   3:    p = (char *)malloc(sizeof(char) * num);
   4: }
   5: void Test(void)
   6: {
   7:    char *str = NULL;
   8:    GetMemory(str, 100); // str 仍然為 NULL
   9:    strcpy(str, "hello"); // 運行錯誤
  10: }

       問題出在函數GetMemory中。編譯器總是要為函數的每個參數製作臨時副本,指針參數p的副本是 _p,編譯器使 _p = p。如果函數體內的程序修改了_p的內容,就導致參數p的內容作相應的修改。這就是指針可以用作輸出參數的原因。在本例中,_p申請了新的內存,隻是把_p所指的內存地址改變了,但是p絲毫未變。所以函數GetMemory並不能輸出任何東西。事實上,每執行一次GetMemory就會泄露一塊內存,因為沒有用free釋放內存。

      如果非得要用指針參數去申請內存,那麼應該改用“指向指針的指針”,見示例:

   1: void GetMemory2(char **p, int num)
   2: {
   3:    *p = (char *)malloc(sizeof(char) * num);
   4: }
   5: void Test2(void)
   6: {
   7:    char *str = NULL;
   8:    GetMemory2(&str, 100); // 注意參數是 &str,而不是str
   9:    strcpy(str, "hello");
  10:    cout<< str << endl;
  11:    free(str);
  12: }

      由於“指向指針的指針”這個概念不容易理解,我們可以用函數返回值來傳遞動態內存。這種方法更加簡單,見示例:

   1: char *GetMemory3(int num)
   2: {
   3:    char *p = (char *)malloc(sizeof(char) * num);
   4:    return p;
   5: }
   6:  
   7: void Test3(void)
   8: {
   9:    char *str = NULL;
  10:    str = GetMemory3(100);
  11:    strcpy(str, "hello");
  12:    cout<< str << endl;
  13:    free(str);
  14: }

      用函數返回值來傳遞動態內存這種方法雖然好用,但是常常有人把return語句用錯了。這裏強調不要用return語句返回指向“棧內存”的指針,因為該內存在函數結束時自動消亡,見示例:

   1: char *GetString(void)
   2: {
   3:    char p[] = "hello world";
   4:    return p; // 編譯器將提出警告
   5: }
   6:  
   7: void Test4(void)
   8: {
   9:    char *str = NULL;
  10:    str = GetString(); // str 的內容是垃圾
  11:    cout<< str << endl;
  12: }

      用調試器逐步跟蹤Test4,發現執行str = GetString語句後str不再是NULL指針,但是str的內容不是“hello world”而是垃圾。

      如果把上述示例改寫成如下示例,會怎麼樣?

   1: char *GetString2(void)
   2: {
   3:    char *p = "hello world";
   4:    return p;
   5: }
   6:  
   7: void Test5(void)
   8: {
   9:    char *str = NULL;
  10:    str = GetString2();
  11:    cout<< str << endl;
  12: }

     函數Test5運行雖然不會出錯,但是函數GetString2的設計概念卻是錯誤的。因為GetString2內的“hello world”是常量字符串,位於靜態存儲區,它在程序生命期內恒定不變。無論什麼時候調用GetString2,它返回的始終是同一個“隻讀”的內存塊。

1.8杜絕“野指針”

“野指針”不是NULL指針,是指向“垃圾”內存的指針。人們一般不會錯用NULL指針,因為用if語句很容易判斷。但是“野指針”是很危險的,if語句對它不起作用。 “野指針”的成因主要有兩種:

(1)指針變量沒有被初始化。任何指針變量剛被創建時不會自動成為NULL指針,它的缺省值是隨機的,它會亂指一氣。所以,指針變量在創建的同時應當被初始化,要麼將指針設置為NULL,要麼讓它指向合法的內存。例如

   1: char *p = NULL;
   2: char *str = (char *) malloc(100);

(2)指針p被free或者delete之後,沒有置為NULL,讓人誤以為p是個合法的指針。

(3)指針操作超越了變量的作用域範圍。這種情況讓人防不勝防,示例程序如下:

   1: class A
   2: {
   3: public:
   4:   void Func(void){ cout << “Func of class A” << endl; }
   5: };
   6:  
   7: void Test(void)
   8: {
   9:    A *p;
  10:    {
  11:     A a;
  12:     p = &a; // 注意 a 的生命期
  13:    }
  14:  
  15:    p->Func(); // p是“野指針”
  16:  
  17: }

函數Test在執行語句p->Func()時,對象a已經消失,而p是指向a的,所以p就成了“野指針”。但奇怪的是我運行這個程序時居然沒有出錯,這可能與編譯器有關。

ps:編寫程序查看這個問題

上麵的這個示例程序,這樣寫沒有錯誤的,請看程序(dev-c++)

#include <iostream>
using namespace std;
class A
{
public:
	A():b(5){}
	void func(void){cout<<"func of class A"<<"輸出b="<<b<<endl;}
private:
	int b;
};
//void test(A* p)
//{
//	A a;
//	p = &a; 
//	cout<<"作用域內p地址"<<&p<<endl;
//	cout<<"作用域內p指向的內容:"<<p<<endl;
//}	
int main()
{
	A *p;
	cout<<"指針p址初始地址"<<&p<<endl;
	cout<<"指針p址初始地址內容"<<p<<endl;;
	{
		A a;
		p = &a; 
		cout<<"作用域內p地址"<<&p<<endl;
		cout<<"作用域內p指向的內容:"<<p<<endl;
	}
		
//	test(p);
	cout<<"指針p地址:"<<&p<<endl;
	cout<<"指針p指向內容"<<p<<endl;
	p->func();
	
	system("PAUSE");
	return 0;
}
輸出為:

可見,編譯器這種情況下是沒有把{ }作為一個區域的,如果將程序中使用注釋掉的代碼,則結果是:


可見,雖然test函數傳入的指針地址變了,但是函數結束後指針p釋放,地址和指向的內容沒有變,此時類A中數據不存了,所以輸出的b是一個隨機值。

程序編譯沒有報錯!。。。

1.9malloc/free和new/delete的區別

      malloc與free是C++/C語言的標準庫函數,new/delete是C++的運算符。它們都可用於申請動態內存和釋放內存。

對於非內部數據類型的對象而言,光用maloc/free無法滿足動態對象的要求。對象在創建的同時要自動執行構造函數,對象在消亡之前要自動執行析構函數。由於malloc/free是庫函數而不是運算符,不在編譯器控製權限之內,不能夠把執行構造函數和析構函數的任務強加於malloc/free。

       因此C++語言需要一個能完成動態內存分配和初始化工作的運算符new,以及一個能完成清理與釋放內存工作的運算符delete。注意new/delete不是庫函數。我們先看一看malloc/free和new/delete如何實現對象的動態內存管理,見示例:

   1: class Obj
   2: {
   3: public :
   4:   Obj(void){ cout << “Initialization” << endl; }
   5:   ~Obj(void){ cout << “Destroy” << endl; }
   6:   void Initialize(void){ cout << “Initialization” << endl; }
   7:   void Destroy(void){ cout << “Destroy” << endl; }
   8: };
   9:  
  10: void UseMallocFree(void)
  11: {
  12:    Obj *a = (obj *)malloc(sizeof(obj)); // 申請動態內存
  13:    a->Initialize(); // 初始化
  14:    //…
  15:  
  16:    a->Destroy(); // 清除工作
  17:    free(a); // 釋放內存
  18: }
  19:  
  20: void UseNewDelete(void)
  21: {
  22:    Obj *a = new Obj; // 申請動態內存並且初始化
  23:    //…
  24:    delete a; // 清除並且釋放內存
  25: }

       類Obj的函數Initialize模擬了構造函數的功能,函數Destroy模擬了析構函數的功能。函數UseMallocFree中,由於malloc/free不能執行構造函數與析構函數,必須調用成員函數Initialize和Destroy來完成初始化與清除工作。函數UseNewDelete則簡單得多。所以我們不要企圖用malloc/free來完成動態對象的內存管理,應該用new/delete。由於內部數據類型的“對象”沒有構造與析構的過程,對它們而言malloc/free和new/delete是等價的。

既然new/delete的功能完全覆蓋了malloc/free,為什麼C++不把malloc/free淘汰出局呢?這是因為C++程序經常要調用C函數,而C程序隻能用malloc/free管理動態內存。如果用free釋放“new創建的動態對象”,那麼該對象因無法執行析構函數而可能導致程序出錯。如果用delete釋放“malloc申請的動態內存”,結果也會導致程序出錯,但是該程序的可讀性很差。所以new/delete必須配對使用,malloc/free也一樣。

1.10 當內存耗盡是怎麼辦?

       如果在申請動態內存時找不到足夠大的內存塊,malloc和new將返回NULL指針,宣告內存申請失敗。通常有三種方式處理“內存耗盡”問題。

(1)判斷指針是否為NULL,如果是則馬上用return語句終止本函數。例如:

   1: void Func(void)
   2: {
   3:    A *a = new A;
   4:    if(a == NULL)
   5:    {
   6:     return;
   7:    }
   8:  
   9:    …
  10: }

     (2)判斷指針是否為NULL,如果是則馬上用exit(1)終止整個程序的運行。例如:

   1: void Func(void)
   2: {
   3:  
   4:    A *a = new A;
   5:    if(a == NULL)
   6:    {
   7:     cout << “Memory Exhausted” << endl;
   8:     exit(1);
   9:    }
  10:  
  11:    …
  12: }

     (3)為new和malloc設置異常處理函數。例如Visual C++可以用_set_new_hander函數為new設置用戶自己定義的異常處理函數,也可以讓malloc享用與new相同的異常處理函數。詳細內容請參考C++使用手冊。

上述(1)(2)方式使用最普遍。如果一個函數內有多處需要申請動態內存,那麼方式(1)就顯得力不從心(釋放內存很麻煩),應該用方式(2)來處理。

很多人不忍心用exit(1),問:“不編寫出錯處理程序,讓操作係統自己解決行不行?”

不行。如果發生“內存耗盡”這樣的事情,一般說來應用程序已經無藥可救。如果不用exit(1) 把壞程序殺死,它可能會害死操作係統。

有一個很重要的現象要告訴大家。對於32位以上的應用程序而言,無論怎樣使用malloc與new,幾乎不可能導致“內存耗盡”。我在Windows 98下用Visual C++編寫了測試程序,見示例7。這個程序會無休止地運行下去,根本不會終止。因為32位操作係統支持“虛存”,內存用完了,自動用硬盤空間頂替。我隻聽到硬盤嘎吱嘎吱地響,Window 98已經累得對鍵盤、鼠標毫無反應。

我可以得出這麼一個結論:對於32位以上的應用程序,“內存耗盡”錯誤處理程序毫無用處。這下可把Unix和Windows程序員們樂壞了:反正錯誤處理程序不起作用,我就不寫了,省了很多麻煩。我不想誤導讀者,必須強調:不加錯誤處理將導致程序的質量很差,千萬不可因小失大

   1: void main(void)
   2: {
   3:     float *p = NULL;
   4:     while(TRUE)
   5:     {
   6:         p = new float[1000000];
   7:         cout << “eat memory” << endl;
   8:         if(p==NULL)
   9:         exit(1);
  10:     }
  11: }

1.11malloc和free的使用要點

    函數malloc的原型如下:

   1: void * malloc(size_t size);

    用malloc申請一塊長度為length的整數類型的內存,程序如下:

   1: int *p = (int *) malloc(sizeof(int) * length);

    我們應當把注意力集中在兩個要素上:“類型轉換”和“sizeof”。

  • malloc返回值的類型是void *,所以在調用malloc時要顯式地進行類型轉換,將void * 轉換成所需要的指針類型。
  • malloc函數本身並不識別要申請的內存是什麼類型,它隻關心內存的總字節數。我們通常記不住int, float等數據類型的變量的確切字節數。例如int變量在16位係統下是2個字節,在32位下是4個字節;而float變量在16位係統下是4個字節,在32位下也是4個字節。最好用以下程序作一次測試:
   1: cout << sizeof(char) << endl;
   2: cout << sizeof(int) << endl;
   3: cout << sizeof(unsigned int) << endl;
   4: cout << sizeof(long) << endl;
   5: cout << sizeof(unsigned long) << endl;
   6: cout << sizeof(float) << endl;
   7: cout << sizeof(double) << endl;
   8: cout << sizeof(void *) << endl;

在malloc的“()”中使用sizeof運算符是良好的風格,但要當心有時我們會昏了頭,寫出 p = malloc(sizeof(p))這樣的程序來。

    函數free的原型如下:

   1: void free( void * memblock );

     為什麼free函數不象malloc函數那樣複雜呢?這是因為指針p的類型以及它所指的內存的容量事先都是知道的,語句free(p)能正確地釋放內存。如果p是NULL指針,那麼free對p無論操作多少次都不會出問題。如果p不是NULL指針,那麼free對p連續操作兩次就會導致程序運行錯誤。

1.12new和delete使用要點

      運算符new使用起來要比函數malloc簡單得多,例如:

   1: int *p1 = (int *)malloc(sizeof(int) * length);
   2: int *p2 = new int[length];

       這是因為new內置了sizeof、類型轉換和類型安全檢查功能。對於非內部數據類型的對象而言,new在創建動態對象的同時完成了初始化工作。如果對象有多個構造函數,那麼new的語句也可以有多種形式。例如

   1: class Obj
   2: {
   3: public :
   4:   Obj(void); // 無參數的構造函數
   5:   Obj(int x); // 帶一個參數的構造函數
   6:  
   7:   …
   8: }
   9:  
  10: void Test(void)
  11: {
  12:      Obj *a = new Obj;
  13:      Obj *b = new Obj(1); // 初值為1
  14:     
  15:      …
  16:     
  17:       delete a;
  18:      delete b;
  19: }

     如果用new創建對象數組,那麼隻能使用對象的無參數構造函數。例如:

   1: Obj *objects = new Obj[100]; // 創建100個動態對象

    不能寫成:

   1: Obj *objects = new Obj[100](1);// 創建100個動態對象的同時賦初值1

     在用delete釋放對象數組時,留意不要丟了符號‘[]’。例如:

   1: delete []objects; // Correct
   2: delete objects; // Wrong
       後者有可能引起程序崩潰和內存泄漏。

PS:C++內存管理部分詳解已經學習完,做好了學習筆記。接下來需要學習C++中健壯的一種指針:一種智能指針,或者說是smart pointers,以及它的特性等,這部分內容需要對C++理解比較深些,會花一些時間學習。


參考文獻:c++內存管理學習綱要

Edit 2013/6/9  11:12  by Atlas

最後更新:2017-04-03 18:52:09

  上一篇:go 圖片信息
  下一篇:go Win8 32位安裝PyLucence