人工智能中的搜索

人工智能中的搜索

article/2025/10/24 7:36:12

最近在mooc学习人工智能：模型于算法，下面记录课上的例子和学到的东西。

首先，人工智能搜索是从海量的信息源中通过约束条件和额外信息运用算法找到问题所对应的答案。

正所谓，你见，或者不见我，我就在那里不悲不喜 ----扎西拉姆多多

以寻找最短路径问题为例：

问题：寻找从Arad到Bucharest的一条最短路径

下面简单说说搜索算法的形式化描述：（状态、动作、状态转移、路径、测试目标）

状态：从原问题转化出的问题描述中。例如，在最短路径问题中，城市可作为状态。将原问题对应的状态称为初始状态。

动作：从当前所处的状态转移到下一时刻的状态所进行的操作。一般而言这些操作都是离散的。

状态转移：对某一时刻对应状态进行某一操作后，所能达到的状态。

路径：一个状态序列。将状态序列被一系列操作所连接。如从Arad到Bucharest所形成的路径。

目标测试：评估当前状态是否为所解的目标状态。

启发式搜索又称有信息搜索，在搜索的过程中liyong利用与所求解问题相关的辅助信息，其代表算法为贪婪最佳优先搜索（Greedy best-first search）和 $A^{*}$ 搜索。

辅助信息：所求解问题之外、与所求解问题相关的特定信息或知识。如该例子中辅助信息为任意一个城市与Bucharest之间的直线距离。

评价函数（evaluation function）f(n)：从当前节点n出发，根据评价函数来选择后续节点。

启发函数（heuristic function）h(n)：计算从节点n到目标节点之间所形成路径的最小代价值。这里将两点之间的直线距离作为启发函数。

下面用贪婪最佳优先搜索：评价函数f(n)=启发函数h(n)

可以得到路线：Arad→Sibiu→Fagaras→Bucharest，但是这并不是最短路线。

不足之处：1.从上可见贪婪最佳优先搜索不是最优的。上述路线比Arad→Sibiu→Rimnicu Vilcea→Bucharest的路径长32公里。

2.启发函数代价最小化这一目标会对错误的起点比较敏感，考虑从Iasi到Fagaras的问题，由启发式建议须先扩展到

Neamt，因为其离Fagaras最近，但是这是一条存在死循环的路径。

3.贪婪优先算法也是不完备的。所谓不完备即它可能沿着一条无限的路劲走下去而不回来做其他的选择尝试，因此无法找到最佳路径这一答案。

4.在最坏的情况下，贪婪最佳优先搜索的时间复杂度和空间复杂度都是O( $b^{m}$ )，其中 $b$ 是节点的分支因子数目、 $m$ 是搜索空间的最大深度。

因此，需要设计一个良好的启发函数。接着介绍一下 $A^{*}$ 搜索。

定义评价函数： $f(n)=g(n)+h(n)$

$g(n)$ 表示从起始节点到节点n的开销代价值， $h(n)$ 表示从节点n到目标节点路径中所估算的最小开小代价值。

$f(n)$ 可视为经过节点n、具有最小开销代价值的路径。

也可以说 $f(n)$ 是评估函数， $g(n)$ 是当前最小开销代价， $h(n)$ 是后续最小开销代价。

为了保证 $A^{*}$ 算法是最优，需要启发函数 $h(n)$ 是可容的和一致的(或者也称是单调的)。

最优：不存在另外一个解法能得到比 $A^{*}$ 算法所求得解法具有更小开销代价。

可容：专门针对启发函数而言，即启发函数不会过高估计从节点n到目标节点之间的实际开销代价(即小于等于实际开销)。如可将两点之间的直线距离作为启发函数，从而保证其可容。

一致性(单调性)：假设节点n的后续节点是n',则从n 到目标节点之间的开销代价一定小于从n到n'的开销再加上从n'到目标节点之间的开销，即 $h(n)\leq c(n,a,n')+h(n')$ 。这里n'是n经过a所抵达的后续节点， $c(n,a,n')$ 指n'和n之间的开销代价。

可见A*算法得出的路径即是最短路径，是最优结果。

1.A*算法保持最优的条件：启发函数具有可容性和一致性。

2.将直线距离作为启发函数h(n)，则启发函数一定是可容的，因为其不会高估开销代价。

3.g(n)是从起点节点到节点n的实际开销代价，且 $f(n)=g(n)+h(n)$ ，因此f(n)不会高估经过节点n路径的实际开销。

http://chatgpt.dhexx.cn/article/YeBVeN82.shtml

相关文章

人工智能——搜索技术

人工智能——搜索技术

转载：https://blog.csdn.net/Sun7_She/article/details/40344329 AI-3的80~84不懂 A*算法不懂引言： 什么是搜索： 根据问题的实际情况不断寻找可利用的知识，构造出一条代价较少的推理路线，使问题得到圆满的解决的过程称…

阅读更多...

新一代智能搜索引擎，让搜索一击即中

新一代智能搜索引擎，让搜索一击即中

什么是搜索？ 搜索引擎的英文为search engine。搜索引擎是一个对互联网信息资源进行搜索整理和分类，并储存在专属网络数据库中供用户查询的系统，包括信息搜集、信息分类、用户查询三部分。从使用者的角度看，搜索引擎提供一个包含…

阅读更多...

浅谈人工智能搜索技术论文

浅谈人工智能搜索技术论文

摘要：本文简单阐述了人工智能中的智能搜索技术的概念以及启发式搜索算法，介绍了几种启发式搜索函数的选择及其研究中遇到的难题，并从中求解来探讨解决问题的思路。关键词：智能搜索；状态空间；与/或树&…

阅读更多...

Python搭建代理IP池（三）- 检测 IP

Python搭建代理IP池（三）- 检测 IP

在获取 IP 时，已经成功将各个网站的代理 IP 获取下来了，然后就需要一个检测模块来对所有的代理进行一轮轮的检测，检测可用就设置为满分，不可用分数就减 1，这样就可以实时改变每个代理的可用情况，在获取有效…

阅读更多...

ProxyPool 爬虫代理IP池(分享)

GitHub - jhao104/proxy_pool: Python爬虫代理IP池(proxy pool)https://github.com/jhao104/proxy_pool/ProxyPool 爬虫代理IP池项目,主要功能为定时采集网上发布的免费代理验证入库，定时验证入库的代理保证代理的可用性，提供API和CLI两种使用方式。同时…

阅读更多...

python爬虫设置代理ip池【源代码】（存入数据库）

python爬虫设置代理ip池【源代码】（存入数据库）

python爬虫设置代理ip池【源代码】在爬取各大网站时，经常遇到一些由于访问次数过多或者访问频率过高，而导致你的ip被“封”。所以我们运用代理ip池来解决这个由于访问频率过高而终止爬取进行。下面介绍一下免费获取代理ip池的方法： 一…

阅读更多...

python3之爬虫代理IP的使用+建立代理IP池

python3之爬虫代理IP的使用+建立代理IP池

爬虫代理IP的使用建立代理IP池代理IP的使用建立代理IP池完整代码代理IP的使用先了解一下百度百科定义的IP 为什么要使用代理IP? 反爬(反网络爬虫) 示例: 测试网址 http://httpbin.org/get 用浏览器先访问测试网址下看看再用我们写的代码简单请求一下网页看看 impo…

阅读更多...

教你创建一个免费的代理IP池（txt存储版本）

教你创建一个免费的代理IP池（txt存储版本）

教你创建一个免费的代理IP池（txt存储版本） 很多人可能会为爬虫被ban，IP被封等反爬机制苦恼，接下来我就教给大家如何白嫖做一个代理IP池。准备工作首先是准备工作，因为是第一个版本，因此我打算先用txt存…

阅读更多...

什么是代理IP池，如何构建？

什么是代理IP池，如何构建？

什么是代理ip池？ 通俗地比喻一下，它就是一个池子，里面装了很多代理ip。它有如下的行为特征： 1.池子里的ip是有生命周期的，它们将被定期验证，其中失效的将被从池子里面剔除。 2.池子里的ip是有补充渠道的&…

阅读更多...

Python爬虫——怎么搭建和维护一个本地IP池

Python爬虫——怎么搭建和维护一个本地IP池

目录背景一、什么是本地代理IP池二、代理IP池功能架构图三、各个组件功能说明及示例代码 1. IP池管理器 2. 代理IP获取器 3. IP质量检测器 4、数据存储器 5、API接口层 6、应用程序总结背景在我们进行爬虫工作时，经常需要使用代理IP。大多数代理…

阅读更多...

搭建代理IP池的方法

搭建代理IP池的方法

突破次数的限制就可以使爬虫更高效的工作，代理IP是突破次数限制，提高爬虫高效工作的最好的工具。所以，很多人都想通过建立IP池的方法，实现换IP突破限制，那么这IP池如何进行搭建呢？一，免费搭建代理IP池的方法 1.主要用途当进行数据爬取的时候，有一部分网站是设置了一些…

阅读更多...

scrapy中添加ip池的方法

scrapy中添加ip池的方法

scrapy中添加ip池的方法我使用的是scrapy2.2 setting 中写下ip池 IPPOOL [{ipaddr:221.230.72.165:80}, {ipaddr:175.154.50.162:8118}, {ipaddr:111.155.116.212:8123},]在在中间件midllewares添加代码 from mypython.settings import IPPOOLfrom scrapy import signals …

阅读更多...

Python爬虫教程：IP池的使用

Python爬虫教程：IP池的使用

一、简介爬虫中为什么需要使用代理一些网站会有相应的反爬虫措施，例如很多网站会检测某一段时间某个IP的访问次数，如果访问频率太快以至于看起来不像正常访客，它可能就会禁止这个IP的访问。所以我们需要设置一些代理IP，每隔一…

阅读更多...

如何建立爬虫代理ip池

如何建立爬虫代理ip池

目录一、为什么需要建立爬虫代理ip池二、如何建立一个爬虫代理ip池原文地址：https://www.cnblogs.com/TurboWay/p/8172246.html 一、为什么需要建立爬虫代理ip池在众多的网站防爬措施中，有一种是根据ip的访问频率进行限制的，在…

阅读更多...

requests模块代理IP池搭建视频爬取

requests模块代理IP池搭建视频爬取

requests模块&代理IP池搭建一 requests模块使用1.1 get请求1.2 url编码和解码1.3 携带请求头1.4 携带cookie1.5 发送post请求1.6 requests.session1.7 Response1.8 获取二进制数据1.9 解析json 二使用代理三 django后端获取客户端ip地址四爬取视频网站五爬取新闻六 Bau…

阅读更多...

Python之爬虫搭建代理ip池

Python之爬虫搭建代理ip池

文章目录前言一、User-Agent二、发送请求三、解析数据四、构建ip代理池，检测ip是否可用五、完整代码总结前言在使用爬虫的时候，很多网站都有一定的反爬措施，甚至在爬取大量的数据或者频繁地访问该网站多次时还可能面临ip被禁，…

阅读更多...

如何构建一个自己的代理ip池

如何构建一个自己的代理ip池

一、默认自动切换IP 登录线程IP池客户端时，默认情况下会自动切换IP。如果不想自动切换IP，或者还没有准备开始使用，请在客户端右侧将“在IP过期前几秒自动申请切换”设置为“0”。 0无效。二.默认情况下不需要授权默认情况下&#xff0c…

阅读更多...

搭建代理IP池

搭建代理IP池

目录爬取前的准备爬取有IP内容检查IP的可用性上一期讲到在爬取豆瓣电影Top250时，出现ip被封的情况，解决方案给出了两种： 1. 换个WiFi或者热点； 2. 搭建代理IP池。那么这期就来搭建代理IP池。通常来说，搭建代理…

阅读更多...

python搭建ip池

python搭建ip池

在爬取网站的时候我们有时候会遭受封ip等显现，因此我们需要搭建自己的ip池用于爬虫。代码过程简述： 1、爬取代理ip网站信息 2、将获取的信息处理得到ip等关键信息 3、保存首次获取的ip信息并检测其是否可用 4、检测完毕将可用ip保存，搭…

阅读更多...

搭建免费代理IP池

搭建免费代理IP池

👨‍💻博客主页：i新木优子👀 🎉欢迎关注🔍点赞👍收藏⭐留言📝 🧚‍♂️寄语:成功的秘诀就是每天都比别人多努力一点👣 ✨有任何疑问欢迎评论探讨先声明一下&…

阅读更多...

推荐文章