STL库：vector

文章目录

STL库：vector
- 1.STL库对vector的官方介绍
- 2.vecotr的常用接口
- - 2.1 vector的构造函数
  - 2.2 vector的迭代器与遍历操作
  - 2.3 vector的容量操作
  - 2.4 vector的访问操作
  - 2.5 vector的修改操作
- 3.vector迭代器失效问题
- - 3.1 insert导致的迭代器失效
  - 3.2 erase导致迭代器失效
- 4.vector的底层结构了解
- 5.vector的模拟实现
- - 5.1 vector的结构
  - 5.2 vector的迭代器
  - 5.3 vector的默认成员函数
  - 5.4 vector的容量操作
  - 5.5 vector的访问操作
  - 5.6 vector的修改操作
  - 5.7 vector的深浅拷贝问题
- 6.vector实现的动态二维数组

1.STL库对vector的官方介绍

vector 是表示可变大小数组的序列容器
就像数组一样，vector 也采用的连续存储空间来存储元素。也就是意味着可以采用下标对 vector 的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理
本质讲，vector 使用动态分配数组来存储它的元素。当新元素插入时候，这个数组需要被重新分配大小为了增加存储空间。其做法是，分配一个新的数组，然后将全部元素移到这个数组。就时间而言，这是一个相对代价高的任务，因为每当一个新的元素加入到容器的时候，vector 并不会每次都重新分配大小
vector 分配空间策略：vector 会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的
因此，vector 占用了更多的存储空间，为了获得管理存储空间的能力，并且以一种有效的方式动态增长
与其它动态序列容器相比（deques, lists and forward_lists）， vector 在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。比起 lists 和 forward_lists 统一的迭代器和引用更好

2.vecotr的常用接口

2.1 vector的构造函数

vecotr()：无参构造（构造一个没有元素的空容器，size = 0）
vector (size_type n, const value_type& val = value_type())：构造一个包含 n 个元素的容器，元素值为 val
vector (const vector& x)：拷贝构造
template <class InputIterator> vector (InputIterator first, InputIterator last);（函数模板）：使用迭代器进行初始化构造 [first,last)

#include <iostream>
#include <vector>//不实用的vector构造用法
void test2()
{// 用其它容器的迭代器初始化，只要数据d类型可以匹配上string s("hello");vector<char> v(s.begin(), s.end());for (auto& e : v){cout << e << " ";}cout << endl;
}int main ()
{std::vector<int> first;                                // 构造一个没有元素的空容器 std::vector<int> second (4,100);                       // 4个值为100的整数std::vector<int> third (second.begin(), second.end()); // 迭代器构造std::vector<int> fourth (third);                       // 拷贝构造// 迭代器构造函数也可以使用数组来进行构造，传的区间是左闭右开// 因为指向数组空间的指针是天然的迭代器int arr[] = {16,2,77,29};std::vector<int> fifth (arr, arr + 4 );// std::vector<int> fifth (arr, arr + sizeof(arr) / sizeof(int) );// first : []// second: [100,100,100,100]// third : [100,100,100,100]// fourth: [100,100,100,100]// fifth : [16,2,77,29]
}

2.2 vector的迭代器与遍历操作

begin(iterator / const_iterator)：返回指向第一个元素的迭代器
rbegin(reverse_iterator / const_reverse_iterator)：反向迭代器（可以反向遍历对象）
end():返回指向最后一个元素的下一个位置的迭代器
rend()：反向迭代器
范围for:C++11 支持更简介的范围 for 的新遍历方式（底层其实是被替换成迭代器，所以支持迭代器就支持范围for)

解释：正向迭代器其实就是一个原生指针 T，反向迭代器不是原生指针，因为原生指针是无法实现 rit++ 倒着走的，是一个被封装的类对象，重载了++运算符，实现了 rit++ 倒着走*

请添加图片描述

void test1()
{vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);v.push_back(4);// 遍历vector// 1. []运算符for (size_t i = 0; i < v.size(); i++){cout << v[i] << " ";}cout << endl;// 2. 迭代器vector<int>::iterator it = v.begin();while (it != v.end()){cout << *it << " ";it++;}cout << endl;// 3. 范围forfor (auto& e : v){cout << e << " ";}cout << endl;
}

2.3 vector的容量操作

size()：返回容器中有效元素个数
resize()：调整容器的有效元素大小（size）
capacity()：返回分配的存储容量大小（即有效元素的最大容量）
reserve()：调整容器的容量大小（capacity）
empty()：判断容器是否为空

1.resize函数：开空间+初始化

void resize (size_type n, value_type val = value_type()); //resize函数原型
//value_type() 是缺省值，是调用 value_type 类型的默认构造函数构造的一个匿名对象//resize举例
void test3()
{vector<char> v;v.resize(10); // v中的10个有效元素全是缺省值'\0'
}

2.reserve函数：只开空间

请添加图片描述

void reserve (size_type n);//reserve函数原型//reserve举例
void test3()
{vector<int> v;v.reserve(10); // 有效元素个数 size = 0，只是开了空间 capacity = 10//插入数据错误写法for (size_t i = 0; i < 10; i++){v[i] = i; // 违规访问，有效数据个数size为0，不能访问它}//插入数据正确写法for (size_t i = 0; i < 10; i++){v.push_back(i);}
}

2.4 vector的访问操作

operator[]：可以像数组一样访问 vector（一般物理地址是连续的才支持）
back：返回容器中最后一个元素的引用
front：返回容器中第一个元素的引用
// []运算符重载函数返回容器中位置 n 处元素的引用
// 函数内部会检查越界
reference operator[] (size_type n);
const_reference operator[] (size_type n) const;

2.5 vector的修改操作

push_back()：在末尾添加一个元素，有效元素个数加1
pop_back()：删除最后一个元素，有效元素个数减1
insert()：在指定迭代器位置的元素之前插入新元素来扩展容器
erase()：从容器中删除单个元素（迭代器位置）或一系列元素（迭代器区间 [first,last) ）
swap()：交换两个容器的内容
clear()：清空容器中所有有效元素，使容器大小 size 为 0

1.insert与erase函数的了解：

//insert：返回指向第一个新插入元素的迭代器
iterator insert (iterator position, const value_type& val); // 插入单个元素//erase：返回被删除元素下一个位置的迭代器
iterator erase (iterator position); // 删除单个元素

2.swap函数的了解：

void swap (vector& x);//swap函数原型vector<int> v1(2, 10); // v1 = [10, 10]
vector<int> v2(5, 50); // v2 = [50, 50, 50 ,50 ,50]
v1.swap(v2);
// v1 = [50, 50, 50 ,50 ,50]
// v2 = [10, 10]

3.vector迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装，比如：vector 的迭代器就是原生态指针 T*。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，而使用一块已经被释放的空间，造成的后果是程序崩溃(即如果继续使用已经失效的迭代器，程序可能会崩溃)

对于vector会引起其底层空间改变的操作，都有可能会导致其迭代器失效，比如：resize、reserve、insert、assign、push_back、erase（指定位置元素的删除操作）等等

3.1 insert导致的迭代器失效

insert操作导致迭代器失效的验证：

1.insert：指定位置之前插入元素操作引发迭代器失效

void test6()
{// 迭代器失效问题 -- 类似野指针问题vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);vector<int>::iterator pos = find(v.begin(), v.end(), 2);if (pos != v.end()){v.insert(pos, 20); // 在pos之前插入20/** 如果想要继续通过迭代器操作 vector 中的元素，需要给 pos 重新赋值* 即 pos = v.insert(pos, 20); // 函数返回指向新插入元素的迭代器*/}// 在insert之后，pos迭代器位置就失效了，不能再去访问了 -- insert时增容导致的//cout << *pos << endl;//*pos = 200;
}//VS2019下验证，程序崩溃
//Linux下验证，虽然没有崩溃（和具体实现、增容机制以及检查机制有关），但也认为失效了

请添加图片描述

那么我们提前把空间开好，在同一块空间下，又是什么情况呢？

void test7()
{// 迭代器失效问题 -- 类似野指针问题vector<int> v;v.reserve(5); // 提前开好空间，防止后续插入元素时发生扩容v.push_back(1);v.push_back(2);v.push_back(3);vector<int>::iterator pos = find(v.begin(), v.end(), 2);if (pos != v.end()){v.insert(pos, 20); // 在pos之前插入20/** 如果想要继续通过迭代器操作 vector 中的元素，需要给 pos 重新赋值* 即 pos = v.insert(pos, 20); // 函数返回指向新插入元素的迭代器*/}// 在insert时空间足够，没有增容，但我们依旧认为pos迭代器位置失效了，不能再去访问了// 这里的失效是指pos位置的意义变了，pos不再指向原来的值//cout << *pos << endl;//*pos = 200;
}
//VS2019下验证，程序崩溃（VS会进行检查）
//Linux下验证，虽然没有崩溃（和具体实现、检查机制有关），但也认为失效了

请添加图片描述

总结：

指定位置之前插入元素操作（insert）导致迭代器失效的两种场景：
insert 插入元素时增容，pos 还指向已被释放的空间（非法空间），所以 pos 位置迭代器失效
insert 插入元素时没有增容，但 pos 位置意义变了，不再指向原来的值，所以 pos 位置迭代器失效

vector 插入元素过程中可能会发生扩容，挪动数据，因此当前迭代器和后面所有元素的迭代器都失效
失效后，我们都不要去访问 pos 位置，否则可能出现各种意外情况

3.2 erase导致迭代器失效

void test8()
{// 迭代器失效问题 -- 类似野指针问题vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);vector<int>::iterator pos = find(v.begin(), v.end(), 2);if (pos != v.end()){v.erase(pos); // 删除pos位置的元素/** 如果想要继续通过迭代器操作 vector 中的元素，需要给 pos 重新赋值* 即 pos = v.erase(pos); // 返回指向被删除元素下一个w的迭代器*/}// 在erase之后，pos迭代器位置就失效了，不能再去访问了// 这里的失效是指pos位置的意义变了，pos不再指向原来的值//cout << *pos << endl;//*pos = 200;
}
//VS2019下验证，程序崩溃（VS会进行检查）
//Linux下验证，虽然没有崩溃（和具体实现、检查机制有关），但也认为失效了

请添加图片描述

总结：

vector 删除元素过程中会牵扯到移动数据，因此当前迭代器和后面所有元素的迭代器都失效
vector 插入或删除元素会导致当前迭代器和后面所有元素的迭代器失效
迭代器失效解决办法：在使用前，对迭代器重新赋值即可
如果想要继续通过迭代器操作 vector 中的元素，需要给 pos 重新赋值

4.vector的底层结构了解

首先我们来看看官方源码，SGI版本STL-vector的实现：

template <class T, class Alloc = alloc>
class vector {
public:typedef T value_type;typedef value_type* iterator; // 指向数组空间的指针T*是天然的d// ...
protected:// ...iterator start;iterator finish;iterator end_of_storage; // 成员变量是三个T*类型的指针// ...
};

官方底层结构的剖析理解图：

请添加图片描述

我们再来看一下源码中 push_back 尾插接口的实现：

请添加图片描述

定位 new 表达式在实际中一般是配合内存池使用。因为 vector 的空间是从内存池来的，内存池分配出的空间是没有初始化的，该空间存放的是哪个自定义类型对象，就使用定位 new 表达式显示调用其构造函数进行初始化

5.vector的模拟实现

5.1 vector的结构

#pragma once#include<iostream>
#include<vector>
#include<string>
#include<cassert> // assert
#include<cstring> // memcpy
using namespace std;namespace winter
{/** T: 模板参数，指vector中存放数据的类型*/template<class T>class vector{public:/*******************************************************/// 迭代器// iterator是内嵌类型，在vector类域里面定义的类型// vector的迭代器是一个原生指针typedef T* iterator;typedef const T* const_iterator;iterator begin() { return _start; }iterator end() { return _finish; }const_iterator begin() const { return _start; }const_iterator end() const { return _finish; }private:iterator _start;          // 指向数组的开始iterator _finish;         // 指向最后一个有效元素的下一个位置iterator _end_of_storage; // 指向空间结束的下一个位置public:/*******************************************************/// 默认成员函数vector(); // 无参构造函数template<class InputIterator>vector(InputIterator first, InputIterator last); // 使用迭代器初始化构造vector(const vector<T>& v); // 拷贝构造（深拷贝）void swap(vector<T>& v) // 交换两个容器的内容vector<T>& operator=(vector<T> v) // 赋值运算符重载（深拷贝）~vector();/*******************************************************/// 容量操作size_t size() const { return _finish - _start; } // 有效元素个数size_t capacity() const { return _end_of_storage - _start; } // 容量大小bool empty() const { return size(); } // 判空void reserve(size_t n); // 调整容器的容量大小（capacity）void resize(size_t n, const T& val = T()); // 调整容器的有效元素大小（size）/*******************************************************/// 访问操作，[]运算符重载T& operator[](const size_t pos);T& operator[](const size_t pos) const;/*******************************************************/// 修改操作iterator insert(iterator pos, const T& val = T()); // 在pos迭代器位置前插入元素iterator erase(iterator pos); // 删除pos迭代器位置的元素void push_back(const T& x); // 尾插void pop_back(); // 尾删};
}

5.2 vector的迭代器

namespace winter
{//T: 模板参数，指vector中存放数据的类型template<class T>class vector{public:/*******************************************************/// 迭代器// iterator是内嵌类型，在vector类域里面定义的类型// vector的迭代器是一个原生指针typedef T* iterator;typedef const T* const_iterator;iterator begin() { return _start; }iterator end() { return _finish; }const_iterator begin() const { return _start; }const_iterator end() const { return _finish; }private:iterator _start;          // 指向数组的开始iterator _finish;         // 指向最后一个有效元素的下一个位置iterator _end_of_storage; // 指向空间结束的下一个位置public:// ...// ...};
}

5.3 vector的默认成员函数

1.构造函数

// 无参构造
vector():_start(nullptr), _finish(nullptr), _end_of_storage(nullptr)
{}// 使用迭代器进行初始化构造 [first,last)
// 注意：若使用vector的 iterator 做形参，会导致初始化的迭代器区间[first,last)只能是vector的迭代器
/* 
* 类模板的成员函数模板，可以自己定义模板参数，比如：
* 这样写的好处是可以传其它容器的迭代器（string、list ...）
* 而不是仅限于用 vector 自己的迭代器 iterator，
* 只要解引用后数据的类型能够和 vector 数据的类型匹配。
*/
template<class InputIterator>
vector(InputIterator first, InputIterator last) // [first,last):_start(nullptr), _finish(nullptr), _end_of_storage(nullptr)
{while (first != last){push_back(*first);first++;}
}

请添加图片描述

2.拷贝构造函数

/* 拷贝构造（深拷贝）的2种传统写法 *///传统写法
// 拷贝构造（深拷贝）
// v2(v1)
vector(const vector<T>& v) :_start(new T[v.capacity()]), _finish(_start + v.size()), _end_of_storage(_start + v.capacity())
{memcpy(_start, v._start, sizeof(T) * v.size()); // 拷贝元素
}
// 拷贝构造（深拷贝），传统写法2 -- 推荐，好处在括号中
// v2(v1)
vector(const vector<T>& v) :_start(nullptr), _finish(nullptr), _end_of_storage(nullptr)
{reserve(v.capacity());  // 调整新容器容量大小（这样的好处是：一次性把空间开好，效率高）for (const auto& e : v) // 尾插元素到新容器中（复用push_back函数）push_back(e);
}//---------------------------------------------------------------------------------//现代写法
// 拷贝构造（深拷贝）
// v2(v1)
vector(const vector<T>& v) :_start(nullptr) // 当前对象是一个正在构造的对象，成员变量还未初始化，是一个随机值，所以先置空, _finish(nullptr), _end_of_storage(nullptr)
{vector<T> tmp(v.begin(), v.end()); // 拿v的内容，调用构造函数构造一个临时对象tmpthis->swap(tmp);                   // 将临时对象tmp和当前对象的成员变量分别进行交换
}

3.赋值运算符重载

//传统写法
// 赋值运算符重载（深拷贝）
// v2 = v1
vector<T>& operator=(const vector<T>& v)
{if (this != &v) // 防止自己给自己赋值{// 释放原空间delete[] _start; _start = _finish = _end_of_storage = nullptr;// 插入元素reserve(v.capacity()); // 调整容量大小for (const auto& e : v)push_back(e);_finish = _start + v.size();_end_of_storage = _start + v.capacity();}return *this;
}		//---------------------------------------------------------//现代写法
// 赋值运算符重载（深拷贝）
// v2 = v1
vector<T>& operator=(vector<T> v) // 通过传值传参，拷贝构造出临时对象
{this->swap(v); // 交换临时对象和当前对象的内容return *this;  // 返回当前对象
}

4.swap函数

//交换两个容器的内容
//swap函数方便实现拷贝构造和赋值重载的现代写法
// v1.swap(v2)
void swap(vector<T>& v)
{// 函数名冲突，指定去调用全局域里面的std::swapstd::swap(_start, v._start);std::swap(_finish, v._finish);std::swap(_end_of_storage, v._end_of_storage);
}

5.析构函数

~vector()
{delete[] _start;_start = _finish = _end_of_storage = nullptr;
}

5.4 vector的容量操作

1.size()、capacity()、empty()

size_t size() const // 有效元素个数
{return _finish - _start;
}size_t capacity() const // 容量大小
{return _end_of_storage - _start;
}bool empty() const // 判空
{return size();
}

2.reserve()

// 调整容器的容量大小（capacity）
void reserve(size_t n)
{if (n > capacity()) // 如果n大于当前 capacity 大小{size_t oldSize = size(); // 提前保存下旧空间size大小，便于后面更新_finishT* tmp = new T[n]; // 开辟并初始化新空间，n个T类型的对象if (_start){// void * memcpy ( void * destination, const void * source, size_t num );memcpy(tmp, _start, sizeof(T) * oldSize); // 旧空间元素拷贝到新空间（浅拷贝）delete[] _start; // 释放旧空间}_start = tmp; // 指向新空间_finish = _start + oldSize;   // 更新有效元素长度_end_of_storage = _start + n; // 更新容量}
}

5.5 vector的访问操作

// []运算符重载，普通版本和 const 版本
T& operator[](const size_t pos)
{assert(pos >= 0 && pos < size()); // 检查越界return _start[pos];
}T& operator[](const size_t pos) const
{assert(pos >= 0 && pos < size()); // 检查越界return _start[pos];
}

5.6 vector的修改操作

1.insert()：注意迭代器失效问题

iterator insert(iterator pos, const T& val = T())
{assert(pos >= _start && pos <= _finish);size_t len = pos - _start; // 记录下pos相对_start的长度if (_finish == _end_of_storage) // 先检查是否需要扩容{size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity();reserve(newcapacity);// 注意：扩容后，pos还指向旧空间，pos位置迭代器已失效，需要重置pospos = _start + len; // 解决迭代器失效问题⭐}// 往后挪动元素for (iterator end = _finish; end > pos; end--){*end = *(end - 1);}*pos = val; // 在pos迭代器位置处插入元素_finish++;  // 有效元素长度+1return pos; // 返回指向第一个新插入元素的迭代器⭐// pos是传值传参，形参改变不会影响实参，所以更需要返回pos
}

2.erase()：注意迭代器失效问题

iterator erase(iterator pos)
{assert(pos >= _start && pos < _finish);// 往前挪动元素for (iterator it = pos + 1; it < _finish; it++){*(it - 1) = *it;}_finish--; // 有效元素长度-1return pos; // 返回指向被删除元素下一个位置的迭代器⭐
}

3.push_back()：

void push_back(const T& x)
{//方法一if (_finish == _end_of_storage) // 先检查是否需要增容{size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity();reserve(newcapacity);}*_finish = x; // 尾插元素_finish++;//方法二：复用 insert 函数的代码 insert(_finish, x);
}

4.pop_back()：

void pop_back()
{//方法一assert(!empty());_finish--;//方法二：复用 erase 函数的代码 erase(--end());
}

5.7 vector的深浅拷贝问题

我们在底层源码可以看到vector::reserve()中使用了memcpy()对数据进行字节序拷贝，这会引发浅拷贝问题

1.memcpy浅拷贝问题的验证：

void test7()
{// memcpy值拷贝的问题vector<string> v;v.reserve(4); // 调整vector的容量为4v.push_back("111");v.push_back("222");v.push_back("333");v.push_back("444");v.push_back("555"); // 这里会发生扩容，调用reserve函数for (auto& e : v)cout << e << endl;
}
//运行结果：程序崩溃

memcpy浅拷贝问题分析：

memcpy 是内存的二进制格式拷贝，将一段内存空间中内容原封不动的拷贝到另外一段内存空间中（字节序拷贝）
如果拷贝的是内置类型的元素，memcpy 即高效又不会出错，但如果拷贝的是自定义类型元素，并且自定义类型元素中涉及到资源管理时（比如在堆上申请的有资源），就会出错，因为memcpy的拷贝实际是浅拷贝

步骤解析：

1.开空间，插入4个string类对象：

2.插入第5个string 类对象，引发扩容，调用 reserve 函数，使用memcpy按字节序拷贝元素到新空间中，是浅拷贝，导致两个对象共享同一份资源：

3.程序结束时，已被析构的空间再次被析构，导致程序崩溃

2.memcpy浅拷贝问题的解决方法：

容器中存的是内置类型元素，直接赋值即可
容器中存的是自定义类型元素，通过调用该自定义类型的赋值运算符重载函数 operator= 完成「深拷贝」

//深拷贝reverse写法// 调整容器的容量大小（capacity）
void reserve(size_t n)
{if (n > capacity()) // 如果n大于当前 capacity 大小{size_t oldSize = size(); // 提前保存下旧空间size大小，便于后面更新_finishT* tmp = new T[n]; // 开辟并初始化新空间，n个T类型的对象if (_start){// 如果T是int，直接赋值即可// 如果T是string，就调用string类的赋值重载（进行深拷贝）// 如果T是vector，就调用vector类的赋值重载（进行深拷贝）for (size_t i = 0; i < oldSize; i++) // 旧空间元素赋值到新空间tmp[i] = _start[i]; // 赋值delete[] _start; // 释放旧空间}_start = tmp; // 指向新空间_finish = _start + oldSize;   // 更新有效元素长度_end_of_storage = _start + n; // 更新容量}
}//---------------------------------------------------------------------//深拷贝size写法
// 调整容器的有效元素大小（size）
void resize(size_t n, const T& val = T())
{// 如果n小于当前size，，则有效元素个数缩小到nif (n < size()){_finish = _start + n;}// 如果n大于当前sizeelse if (n > size()){// 如果n大于当前capacity，先进行增容if (n > capacity()) reserve(n);// 多出的位置用val或者缺省值T()填充while (_finish < _start + n){*_finish = val;_finish++;      // 有效元素长度+1}}
}

6.vector实现的动态二维数组

比如杨辉三角(用动态二维数组构建)：

请添加图片描述

数组形式表示：

请添加图片描述

class Solution 
{
public:vector<vector<int>> generate(int n) {// 开辟和初始化杨辉三角存储空间vector<vector<int>> vv(n);for (size_t i = 0; i < vv.size(); i++){vv[i].resize(i + 1, 0);// 每一行第一个元素和最后一个元素初始化为1vv[i][0] = 1;vv[i][vv[i].size() - 1] = 1;}// 填充杨辉三角for (size_t i = 2; i < vv.size(); i++) // 从第3行开始for (size_t j = 1; j < vv[i].size() - 1; j++) // 从第2列开始vv[i][j] = vv[i - 1][j - 1] + vv[i - 1][j];return vv;}
};