STL库:vector
文章目录
- STL库:vector
- 1.STL库对vector的官方介绍
- 2.vecotr的常用接口
- 2.1 vector的构造函数
- 2.2 vector的迭代器与遍历操作
- 2.3 vector的容量操作
- 2.4 vector的访问操作
- 2.5 vector的修改操作
- 3.vector迭代器失效问题
- 3.1 insert导致的迭代器失效
- 3.2 erase导致迭代器失效
- 4.vector的底层结构了解
- 5.vector的模拟实现
- 5.1 vector的结构
- 5.2 vector的迭代器
- 5.3 vector的默认成员函数
- 5.4 vector的容量操作
- 5.5 vector的访问操作
- 5.6 vector的修改操作
- 5.7 vector的深浅拷贝问题
- 6.vector实现的动态二维数组
1.STL库对vector的官方介绍
- vector 是表示可变大小数组的序列容器
- 就像数组一样,vector 也采用的连续存储空间来存储元素。也就是意味着可以采用下标对 vector 的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理
- 本质讲,vector 使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector 并不会每次都重新分配大小
- vector 分配空间策略:vector 会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的
- 因此,vector 占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长
- 与其它动态序列容器相比(deques, lists and forward_lists), vector 在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起 lists 和 forward_lists 统一的迭代器和引用更好
2.vecotr的常用接口
2.1 vector的构造函数
- vecotr():无参构造(构造一个没有元素的空容器,size = 0)
- vector (size_type n, const value_type& val = value_type()):构造一个包含 n 个元素的容器,元素值为 val
- vector (const vector& x):拷贝构造
template <class InputIterator> vector (InputIterator first, InputIterator last);
(函数模板):使用迭代器进行初始化构造 [first,last)
#include <iostream>
#include <vector>//不实用的vector构造用法
void test2()
{// 用其它容器的迭代器初始化,只要数据d类型可以匹配上string s("hello");vector<char> v(s.begin(), s.end());for (auto& e : v){cout << e << " ";}cout << endl;
}int main ()
{std::vector<int> first; // 构造一个没有元素的空容器 std::vector<int> second (4,100); // 4个值为100的整数std::vector<int> third (second.begin(), second.end()); // 迭代器构造std::vector<int> fourth (third); // 拷贝构造// 迭代器构造函数也可以使用数组来进行构造,传的区间是左闭右开// 因为指向数组空间的指针是天然的迭代器int arr[] = {16,2,77,29};std::vector<int> fifth (arr, arr + 4 );// std::vector<int> fifth (arr, arr + sizeof(arr) / sizeof(int) );// first : []// second: [100,100,100,100]// third : [100,100,100,100]// fourth: [100,100,100,100]// fifth : [16,2,77,29]
}
2.2 vector的迭代器与遍历操作
- begin(iterator / const_iterator):返回指向第一个元素的迭代器
- rbegin(reverse_iterator / const_reverse_iterator):反向迭代器(可以反向遍历对象)
- end():返回指向最后一个元素的下一个位置的迭代器
- rend():反向迭代器
- 范围for:C++11 支持更简介的范围 for 的新遍历方式(底层其实是被替换成迭代器,所以支持迭代器就支持范围for)
解释:正向迭代器其实就是一个原生指针 T,反向迭代器不是原生指针,因为原生指针是无法实现 rit++ 倒着走的,是一个被封装的类对象,重载了++运算符,实现了 rit++ 倒着走*
void test1()
{vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);v.push_back(4);// 遍历vector// 1. []运算符for (size_t i = 0; i < v.size(); i++){cout << v[i] << " ";}cout << endl;// 2. 迭代器vector<int>::iterator it = v.begin();while (it != v.end()){cout << *it << " ";it++;}cout << endl;// 3. 范围forfor (auto& e : v){cout << e << " ";}cout << endl;
}
2.3 vector的容量操作
- size():返回容器中有效元素个数
- resize():调整容器的有效元素大小(size)
- capacity():返回分配的存储容量大小(即有效元素的最大容量)
- reserve():调整容器的容量大小(capacity)
- empty():判断容器是否为空
1.resize函数:开空间+初始化
void resize (size_type n, value_type val = value_type()); //resize函数原型
//value_type() 是缺省值,是调用 value_type 类型的默认构造函数构造的一个匿名对象//resize举例
void test3()
{vector<char> v;v.resize(10); // v中的10个有效元素全是缺省值'\0'
}
2.reserve函数:只开空间
void reserve (size_type n);//reserve函数原型//reserve举例
void test3()
{vector<int> v;v.reserve(10); // 有效元素个数 size = 0,只是开了空间 capacity = 10//插入数据错误写法for (size_t i = 0; i < 10; i++){v[i] = i; // 违规访问,有效数据个数size为0,不能访问它}//插入数据正确写法for (size_t i = 0; i < 10; i++){v.push_back(i);}
}
2.4 vector的访问操作
- operator[]:可以像数组一样访问 vector(一般物理地址是连续的才支持)
- back:返回容器中最后一个元素的引用
- front:返回容器中第一个元素的引用
// []运算符重载函数返回容器中位置 n 处元素的引用 // 函数内部会检查越界 reference operator[] (size_type n); const_reference operator[] (size_type n) const;
2.5 vector的修改操作
- push_back():在末尾添加一个元素,有效元素个数加1
- pop_back():删除最后一个元素,有效元素个数减1
- insert():在指定迭代器位置的元素之前插入新元素来扩展容器
- erase():从容器中删除单个元素(迭代器位置)或一系列元素(迭代器区间
[first,last)
)- swap():交换两个容器的内容
- clear():清空容器中所有有效元素,使容器大小 size 为 0
1.insert与erase函数的了解:
//insert:返回指向第一个新插入元素的迭代器
iterator insert (iterator position, const value_type& val); // 插入单个元素//erase:返回被删除元素下一个位置的迭代器
iterator erase (iterator position); // 删除单个元素
2.swap函数的了解:
void swap (vector& x);//swap函数原型vector<int> v1(2, 10); // v1 = [10, 10]
vector<int> v2(5, 50); // v2 = [50, 50, 50 ,50 ,50]
v1.swap(v2);
// v1 = [50, 50, 50 ,50 ,50]
// v2 = [10, 10]
3.vector迭代器失效问题
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector 的迭代器就是原生态指针
T*
。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)对于vector会引起其底层空间改变的操作,都有可能会导致其迭代器失效,比如:resize、reserve、insert、assign、push_back、erase(指定位置元素的删除操作)等等
3.1 insert导致的迭代器失效
insert操作导致迭代器失效的验证:
1.insert:指定位置之前插入元素操作引发迭代器失效
void test6()
{// 迭代器失效问题 -- 类似野指针问题vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);vector<int>::iterator pos = find(v.begin(), v.end(), 2);if (pos != v.end()){v.insert(pos, 20); // 在pos之前插入20/** 如果想要继续通过迭代器操作 vector 中的元素,需要给 pos 重新赋值* 即 pos = v.insert(pos, 20); // 函数返回指向新插入元素的迭代器*/}// 在insert之后,pos迭代器位置就失效了,不能再去访问了 -- insert时增容导致的//cout << *pos << endl;//*pos = 200;
}//VS2019下验证,程序崩溃
//Linux下验证,虽然没有崩溃(和具体实现、增容机制以及检查机制有关),但也认为失效了
那么我们提前把空间开好,在同一块空间下,又是什么情况呢?
void test7()
{// 迭代器失效问题 -- 类似野指针问题vector<int> v;v.reserve(5); // 提前开好空间,防止后续插入元素时发生扩容v.push_back(1);v.push_back(2);v.push_back(3);vector<int>::iterator pos = find(v.begin(), v.end(), 2);if (pos != v.end()){v.insert(pos, 20); // 在pos之前插入20/** 如果想要继续通过迭代器操作 vector 中的元素,需要给 pos 重新赋值* 即 pos = v.insert(pos, 20); // 函数返回指向新插入元素的迭代器*/}// 在insert时空间足够,没有增容,但我们依旧认为pos迭代器位置失效了,不能再去访问了// 这里的失效是指pos位置的意义变了,pos不再指向原来的值//cout << *pos << endl;//*pos = 200;
}
//VS2019下验证,程序崩溃(VS会进行检查)
//Linux下验证,虽然没有崩溃(和具体实现、检查机制有关),但也认为失效了
总结:
- 指定位置之前插入元素操作(insert)导致迭代器失效的两种场景:
- insert 插入元素时增容,pos 还指向已被释放的空间(非法空间),所以 pos 位置迭代器失效
- insert 插入元素时没有增容,但 pos 位置意义变了,不再指向原来的值,所以 pos 位置迭代器失效
- vector 插入元素过程中可能会发生扩容,挪动数据,因此当前迭代器和后面所有元素的迭代器都失效
- 失效后,我们都不要去访问 pos 位置,否则可能出现各种意外情况
3.2 erase导致迭代器失效
void test8()
{// 迭代器失效问题 -- 类似野指针问题vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);vector<int>::iterator pos = find(v.begin(), v.end(), 2);if (pos != v.end()){v.erase(pos); // 删除pos位置的元素/** 如果想要继续通过迭代器操作 vector 中的元素,需要给 pos 重新赋值* 即 pos = v.erase(pos); // 返回指向被删除元素下一个w的迭代器*/}// 在erase之后,pos迭代器位置就失效了,不能再去访问了// 这里的失效是指pos位置的意义变了,pos不再指向原来的值//cout << *pos << endl;//*pos = 200;
}
//VS2019下验证,程序崩溃(VS会进行检查)
//Linux下验证,虽然没有崩溃(和具体实现、检查机制有关),但也认为失效了
总结:
- vector 删除元素过程中会牵扯到移动数据,因此当前迭代器和后面所有元素的迭代器都失效
- vector 插入或删除元素会导致当前迭代器和后面所有元素的迭代器失效
- 迭代器失效解决办法:在使用前,对迭代器重新赋值即可
- 如果想要继续通过迭代器操作 vector 中的元素,需要给 pos 重新赋值
4.vector的底层结构了解
首先我们来看看官方源码,SGI版本STL-vector的实现:
template <class T, class Alloc = alloc>
class vector {
public:typedef T value_type;typedef value_type* iterator; // 指向数组空间的指针T*是天然的d// ...
protected:// ...iterator start;iterator finish;iterator end_of_storage; // 成员变量是三个T*类型的指针// ...
};
官方底层结构的剖析理解图:
我们再来看一下源码中 push_back 尾插接口的实现:
定位 new 表达式在实际中一般是配合内存池使用。因为 vector 的空间是从内存池来的,内存池分配出的空间是没有初始化的,该空间存放的是哪个自定义类型对象,就使用定位 new 表达式显示调用其构造函数进行初始化
5.vector的模拟实现
5.1 vector的结构
#pragma once#include<iostream>
#include<vector>
#include<string>
#include<cassert> // assert
#include<cstring> // memcpy
using namespace std;namespace winter
{/** T: 模板参数,指vector中存放数据的类型*/template<class T>class vector{public:/*******************************************************/// 迭代器// iterator是内嵌类型,在vector类域里面定义的类型// vector的迭代器是一个原生指针typedef T* iterator;typedef const T* const_iterator;iterator begin() { return _start; }iterator end() { return _finish; }const_iterator begin() const { return _start; }const_iterator end() const { return _finish; }private:iterator _start; // 指向数组的开始iterator _finish; // 指向最后一个有效元素的下一个位置iterator _end_of_storage; // 指向空间结束的下一个位置public:/*******************************************************/// 默认成员函数vector(); // 无参构造函数template<class InputIterator>vector(InputIterator first, InputIterator last); // 使用迭代器初始化构造vector(const vector<T>& v); // 拷贝构造(深拷贝)void swap(vector<T>& v) // 交换两个容器的内容vector<T>& operator=(vector<T> v) // 赋值运算符重载(深拷贝)~vector();/*******************************************************/// 容量操作size_t size() const { return _finish - _start; } // 有效元素个数size_t capacity() const { return _end_of_storage - _start; } // 容量大小bool empty() const { return size(); } // 判空void reserve(size_t n); // 调整容器的容量大小(capacity)void resize(size_t n, const T& val = T()); // 调整容器的有效元素大小(size)/*******************************************************/// 访问操作,[]运算符重载T& operator[](const size_t pos);T& operator[](const size_t pos) const;/*******************************************************/// 修改操作iterator insert(iterator pos, const T& val = T()); // 在pos迭代器位置前插入元素iterator erase(iterator pos); // 删除pos迭代器位置的元素void push_back(const T& x); // 尾插void pop_back(); // 尾删};
}
5.2 vector的迭代器
namespace winter
{//T: 模板参数,指vector中存放数据的类型template<class T>class vector{public:/*******************************************************/// 迭代器// iterator是内嵌类型,在vector类域里面定义的类型// vector的迭代器是一个原生指针typedef T* iterator;typedef const T* const_iterator;iterator begin() { return _start; }iterator end() { return _finish; }const_iterator begin() const { return _start; }const_iterator end() const { return _finish; }private:iterator _start; // 指向数组的开始iterator _finish; // 指向最后一个有效元素的下一个位置iterator _end_of_storage; // 指向空间结束的下一个位置public:// ...// ...};
}
5.3 vector的默认成员函数
1.构造函数
// 无参构造
vector():_start(nullptr), _finish(nullptr), _end_of_storage(nullptr)
{}// 使用迭代器进行初始化构造 [first,last)
// 注意:若使用vector的 iterator 做形参,会导致初始化的迭代器区间[first,last)只能是vector的迭代器
/*
* 类模板的成员函数模板,可以自己定义模板参数,比如:
* 这样写的好处是可以传其它容器的迭代器(string、list ...)
* 而不是仅限于用 vector 自己的迭代器 iterator,
* 只要解引用后数据的类型能够和 vector 数据的类型匹配。
*/
template<class InputIterator>
vector(InputIterator first, InputIterator last) // [first,last):_start(nullptr), _finish(nullptr), _end_of_storage(nullptr)
{while (first != last){push_back(*first);first++;}
}
2.拷贝构造函数
/* 拷贝构造(深拷贝)的2种传统写法 *///传统写法
// 拷贝构造(深拷贝)
// v2(v1)
vector(const vector<T>& v) :_start(new T[v.capacity()]), _finish(_start + v.size()), _end_of_storage(_start + v.capacity())
{memcpy(_start, v._start, sizeof(T) * v.size()); // 拷贝元素
}
// 拷贝构造(深拷贝),传统写法2 -- 推荐,好处在括号中
// v2(v1)
vector(const vector<T>& v) :_start(nullptr), _finish(nullptr), _end_of_storage(nullptr)
{reserve(v.capacity()); // 调整新容器容量大小(这样的好处是:一次性把空间开好,效率高)for (const auto& e : v) // 尾插元素到新容器中(复用push_back函数)push_back(e);
}//---------------------------------------------------------------------------------//现代写法
// 拷贝构造(深拷贝)
// v2(v1)
vector(const vector<T>& v) :_start(nullptr) // 当前对象是一个正在构造的对象,成员变量还未初始化,是一个随机值,所以先置空, _finish(nullptr), _end_of_storage(nullptr)
{vector<T> tmp(v.begin(), v.end()); // 拿v的内容,调用构造函数构造一个临时对象tmpthis->swap(tmp); // 将临时对象tmp和当前对象的成员变量分别进行交换
}
3.赋值运算符重载
//传统写法
// 赋值运算符重载(深拷贝)
// v2 = v1
vector<T>& operator=(const vector<T>& v)
{if (this != &v) // 防止自己给自己赋值{// 释放原空间delete[] _start; _start = _finish = _end_of_storage = nullptr;// 插入元素reserve(v.capacity()); // 调整容量大小for (const auto& e : v)push_back(e);_finish = _start + v.size();_end_of_storage = _start + v.capacity();}return *this;
} //---------------------------------------------------------//现代写法
// 赋值运算符重载(深拷贝)
// v2 = v1
vector<T>& operator=(vector<T> v) // 通过传值传参,拷贝构造出临时对象
{this->swap(v); // 交换临时对象和当前对象的内容return *this; // 返回当前对象
}
4.swap函数
//交换两个容器的内容
//swap函数方便实现拷贝构造和赋值重载的现代写法
// v1.swap(v2)
void swap(vector<T>& v)
{// 函数名冲突,指定去调用全局域里面的std::swapstd::swap(_start, v._start);std::swap(_finish, v._finish);std::swap(_end_of_storage, v._end_of_storage);
}
5.析构函数
~vector()
{delete[] _start;_start = _finish = _end_of_storage = nullptr;
}
5.4 vector的容量操作
1.size()、capacity()、empty()
size_t size() const // 有效元素个数
{return _finish - _start;
}size_t capacity() const // 容量大小
{return _end_of_storage - _start;
}bool empty() const // 判空
{return size();
}
2.reserve()
// 调整容器的容量大小(capacity)
void reserve(size_t n)
{if (n > capacity()) // 如果n大于当前 capacity 大小{size_t oldSize = size(); // 提前保存下旧空间size大小,便于后面更新_finishT* tmp = new T[n]; // 开辟并初始化新空间,n个T类型的对象if (_start){// void * memcpy ( void * destination, const void * source, size_t num );memcpy(tmp, _start, sizeof(T) * oldSize); // 旧空间元素拷贝到新空间(浅拷贝)delete[] _start; // 释放旧空间}_start = tmp; // 指向新空间_finish = _start + oldSize; // 更新有效元素长度_end_of_storage = _start + n; // 更新容量}
}
5.5 vector的访问操作
// []运算符重载,普通版本和 const 版本
T& operator[](const size_t pos)
{assert(pos >= 0 && pos < size()); // 检查越界return _start[pos];
}T& operator[](const size_t pos) const
{assert(pos >= 0 && pos < size()); // 检查越界return _start[pos];
}
5.6 vector的修改操作
1.insert():注意迭代器失效问题
iterator insert(iterator pos, const T& val = T())
{assert(pos >= _start && pos <= _finish);size_t len = pos - _start; // 记录下pos相对_start的长度if (_finish == _end_of_storage) // 先检查是否需要扩容{size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity();reserve(newcapacity);// 注意:扩容后,pos还指向旧空间,pos位置迭代器已失效,需要重置pospos = _start + len; // 解决迭代器失效问题⭐}// 往后挪动元素for (iterator end = _finish; end > pos; end--){*end = *(end - 1);}*pos = val; // 在pos迭代器位置处插入元素_finish++; // 有效元素长度+1return pos; // 返回指向第一个新插入元素的迭代器⭐// pos是传值传参,形参改变不会影响实参,所以更需要返回pos
}
2.erase():注意迭代器失效问题
iterator erase(iterator pos)
{assert(pos >= _start && pos < _finish);// 往前挪动元素for (iterator it = pos + 1; it < _finish; it++){*(it - 1) = *it;}_finish--; // 有效元素长度-1return pos; // 返回指向被删除元素下一个位置的迭代器⭐
}
3.push_back():
void push_back(const T& x)
{//方法一if (_finish == _end_of_storage) // 先检查是否需要增容{size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity();reserve(newcapacity);}*_finish = x; // 尾插元素_finish++;//方法二:复用 insert 函数的代码 insert(_finish, x);
}
4.pop_back():
void pop_back()
{//方法一assert(!empty());_finish--;//方法二:复用 erase 函数的代码 erase(--end());
}
5.7 vector的深浅拷贝问题
我们在底层源码可以看到vector::reserve()中使用了memcpy()对数据进行字节序拷贝,这会引发浅拷贝问题
1.memcpy浅拷贝问题的验证:
void test7()
{// memcpy值拷贝的问题vector<string> v;v.reserve(4); // 调整vector的容量为4v.push_back("111");v.push_back("222");v.push_back("333");v.push_back("444");v.push_back("555"); // 这里会发生扩容,调用reserve函数for (auto& e : v)cout << e << endl;
}
//运行结果:程序崩溃
memcpy浅拷贝问题分析:
- memcpy 是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中(字节序拷贝)
- 如果拷贝的是内置类型的元素,memcpy 即高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时(比如在堆上申请的有资源),就会出错,因为memcpy的拷贝实际是浅拷贝
步骤解析:
1.开空间,插入4个string类对象:
2.插入第5个string 类对象,引发扩容,调用 reserve 函数,使用memcpy按字节序拷贝元素到新空间中,是浅拷贝,导致两个对象共享同一份资源:
3.程序结束时,已被析构的空间再次被析构,导致程序崩溃
2.memcpy浅拷贝问题的解决方法:
- 容器中存的是内置类型元素,直接赋值即可
- 容器中存的是自定义类型元素,通过调用该自定义类型的赋值运算符重载函数 operator= 完成「深拷贝」
//深拷贝reverse写法// 调整容器的容量大小(capacity)
void reserve(size_t n)
{if (n > capacity()) // 如果n大于当前 capacity 大小{size_t oldSize = size(); // 提前保存下旧空间size大小,便于后面更新_finishT* tmp = new T[n]; // 开辟并初始化新空间,n个T类型的对象if (_start){// 如果T是int,直接赋值即可// 如果T是string,就调用string类的赋值重载(进行深拷贝)// 如果T是vector,就调用vector类的赋值重载(进行深拷贝)for (size_t i = 0; i < oldSize; i++) // 旧空间元素赋值到新空间tmp[i] = _start[i]; // 赋值delete[] _start; // 释放旧空间}_start = tmp; // 指向新空间_finish = _start + oldSize; // 更新有效元素长度_end_of_storage = _start + n; // 更新容量}
}//---------------------------------------------------------------------//深拷贝size写法
// 调整容器的有效元素大小(size)
void resize(size_t n, const T& val = T())
{// 如果n小于当前size,,则有效元素个数缩小到nif (n < size()){_finish = _start + n;}// 如果n大于当前sizeelse if (n > size()){// 如果n大于当前capacity,先进行增容if (n > capacity()) reserve(n);// 多出的位置用val或者缺省值T()填充while (_finish < _start + n){*_finish = val;_finish++; // 有效元素长度+1}}
}
6.vector实现的动态二维数组
比如杨辉三角(用动态二维数组构建):
数组形式表示:
class Solution
{
public:vector<vector<int>> generate(int n) {// 开辟和初始化杨辉三角存储空间vector<vector<int>> vv(n);for (size_t i = 0; i < vv.size(); i++){vv[i].resize(i + 1, 0);// 每一行第一个元素和最后一个元素初始化为1vv[i][0] = 1;vv[i][vv[i].size() - 1] = 1;}// 填充杨辉三角for (size_t i = 2; i < vv.size(); i++) // 从第3行开始for (size_t j = 1; j < vv[i].size() - 1; j++) // 从第2列开始vv[i][j] = vv[i - 1][j - 1] + vv[i - 1][j];return vv;}
};
二维数组 vector<vector<int>> vv
中总共有 n 个元素,每个元素都是 vector<int>
类型的,比如当n=5时,如下图存储结构:
填充二维数组的每一个元素: