Java根据IP地址获取对应归属地

article/2025/10/25 6:42:25

1 前言

最近,各大平台都新增了评论区显示发言者ip归属地的功能,例如哔哩哔哩,微博,知乎等等,下面,就来讲讲,Java 中是如何获取 IP 属地的

2 获取IP地址

在Java中有多种获取IP地址的方式,就不一一介绍了,给出了一个最常用的IP地址获取方式,仅供参考,代码如下:

@Slf4j
public class IpUtils {/*** 获取ip地址* @param request request对象* @return 返回对应IP地址*/public static String getIpAddress(HttpServletRequest request){String ipAddress = null;try {ipAddress = request.getHeader("X-Forwarded-For");if (ipAddress != null && ipAddress.length() != 0 && !"unknown".equalsIgnoreCase(ipAddress)) {// 多次反向代理后会有多个ip值,第一个ip才是真实ipif (ipAddress.contains(",")) {ipAddress = ipAddress.split(",")[0];}}if (ipAddress == null || ipAddress.length() == 0 || "unknown".equalsIgnoreCase(ipAddress)) {ipAddress = request.getHeader("Proxy-Client-IP");}if (ipAddress == null || ipAddress.length() == 0 || "unknown".equalsIgnoreCase(ipAddress)) {ipAddress = request.getHeader("WL-Proxy-Client-IP");}if (ipAddress == null || ipAddress.length() == 0 || "unknown".equalsIgnoreCase(ipAddress)) {ipAddress = request.getHeader("HTTP_CLIENT_IP");}if (ipAddress == null || ipAddress.length() == 0 || "unknown".equalsIgnoreCase(ipAddress)) {ipAddress = request.getRemoteAddr();}}catch (Exception e) {log.error("IPUtils ERROR ",e);}return ipAddress;}/*** 获取mac地址*/public static String getMacAddress() throws Exception {// 取mac地址byte[] macAddressBytes = NetworkInterface.getByInetAddress(InetAddress.getLocalHost()).getHardwareAddress();// 下面代码是把mac地址拼装成StringStringBuilder sb = new StringBuilder();for (int i = 0; i < macAddressBytes.length; i++) {if (i != 0) {sb.append("-");}// mac[i] & 0xFF 是为了把byte转化为正整数String s = Integer.toHexString(macAddressBytes[i] & 0xFF);sb.append(s.length() == 1 ? 0 + s : s);}return sb.toString().trim().toUpperCase();}}

对这里出现的几个名词解释一下:

  • X-Forwarded-For:一个 HTTP 扩展头部,主要是为了让 Web 服务器获取访问用户的真实 IP 地址。每个 IP地址,每个值通过逗号+空格分开,最左边是最原始客户端的 IP 地址,中间如果有多层代理,每⼀层代理会将连接它的客户端 IP 追加在X-Forwarded-For 右边。
  • Proxy-Client-IP:这个一般是经过 Apache http 服务器的请求才会有,用 Apache http做代理时一般会加上Proxy-Client-IP 请求头
  • WL-Proxy-Client-IP:也是通过 Apache http 服务器,在 weblogic 插件加上的头。
  • X-Real-IP:一般只记录真实发出请求的客户端IP
  • HTTP_CLIENT_IP:代理服务器发送的HTTP头。如果是“超级匿名代理”,则返回none值。

3 Ip2region介绍

3.1 99.9% 准确率

数据聚合了一些知名 ip 到地名查询提供商的数据,这些是他们官方的的准确率,经测试着实比经典的纯真 IP 定位准确一些。

ip2region 的数据聚合自以下服务商的开放 API 或者数据(升级程序每秒请求次数 2 到 4 次):

  • 01,>80%,淘宝IP地址库,http://ip.taobao.com/%5C
  • 02,≈10%,GeoIP,https://geoip.com/%5C
  • 03,≈2%,纯真 IP 库,http://www.cz88.net/%5C

备注:如果上述开放 API 或者数据都不给开放数据时 ip2region 将停止数据的更新服务。

3.2 多查询客户端的支持

已经集成的客户端有:java、C#、php、c、python、nodejs、php扩展(php5 和 php7)、golang、rust、lua、lua_c,nginx。
在这里插入图片描述

3.3 Ip2region V2.0 特性

3.3.1 标准化的数据格式

每个 ip 数据段的 region 信息都固定了格式:国家|区域|省份|城市|ISP,只有中国的数据绝大部分精确到了城市,其他国家部分数据只能定位到国家,后前的选项全部是 0。

3.3.2 数据去重和压缩

xdb 格式生成程序会自动去重和压缩部分数据,默认的全部 IP 数据,生成的 ip2region.xdb 数据库是 11MiB,随着数据的详细度增加数据库的大小也慢慢增大。

3.3.3 极速查询响应

即使是完全基于 xdb 文件的查询,单次查询响应时间在十微秒级别。

可通过如下两种方式开启内存加速查询:

  • vIndex 索引缓存:使用固定的 512KiB 的内存空间缓存 vector index 数据,减少一次 IO
    磁盘操作,保持平均查询效率稳定在 10-20 微秒之间。
  • xdb 整个文件缓存:将整个 xdb 文件全部加载到内存,内存占用等同于 xdb 文件大小,无磁盘 IO 操作,保持微秒级别的查询效率。

3.3.4 极速查询响应

v2.0 格式的 xdb 支持亿级别的 IP 数据段行数,region 信息也可以完全自定义,例如:你可以在 region 中追加特定业务需求的数据,例如:GPS信息/国际统一地域信息编码/邮编等。也就是你完全可以使用 ip2region 来管理你自己的 IP 定位数据。

4 获取ip2region.xdb文件

为什么要获取ip2region.xdb文件呢?是因为获取ip属地是以这个文件为基础的

4.1 直接获取

文件我已经打包到百度网盘了,小伙伴们可以直接下载,地址如下:
链接:https://pan.baidu.com/s/1JSB0z2Cwl4umujKUzpBhFA
提取码:0zz5

4.2 自行打包

下载项目:
链接:https://pan.baidu.com/s/1wHjUoHCmyH_PVcB9nf3cLw
提取码:aq5y
进入到target文件夹,执行命令:

java -jar ip2region-maker-1.0.0.jar --src=./ip.merge.txt --dst=./ip2region.xdb

5 使用Ip2region V2.0通过 IP 地址,获取对应的省份、城市

5.1 内置的三种查询算法

全部的查询客户端单次查询都在 0.x 毫秒级别,内置了三种查询算法

  • memory 算法:整个数据库全部载入内存,单次查询都在0.1x毫秒内,C语言的客户端单次查询在0.00x毫秒级别。
  • binary 算法:基于二分查找,基于ip2region.db文件,不需要载入内存,单次查询在0.x毫秒级别。
  • b-tree 算法:基于btree算法,基于ip2region.db文件,不需要载入内存,单词查询在0.x毫秒级别,比binary算法更快。

5.2 具体实现方法

5.2.1 引入ip2region依赖

<dependency><groupId>org.lionsoul</groupId><artifactId>ip2region</artifactId><version>2.6.4</version>
</dependency>

5.2.2 ip2region.xdb 文件,放到工程resources目录下

在这里插入图片描述

5.2.3 完全基于ip2region.xdb文件,对用户ip地址进行转换

    /*** 获取ip属地(文件扫描)* @param ip IP地址* @return 返回地址*/public static String getCityInfoByFile(String ip) {// 1、创建 searcher 对象String dbPath = "D:\\gitProject\\workRecord\\src\\main\\resources\\ip\\ip2region.xdb";Searcher searcher;try {searcher = Searcher.newWithFileOnly(dbPath);} catch (IOException e) {log.error("failed to create searcher with `{}`: ", dbPath, e);return null;}// 2、查询try {long sTime = System.nanoTime();String region = searcher.search(ip);long cost = TimeUnit.NANOSECONDS.toMicros(System.nanoTime() - sTime);log.info("{region: {}, ioCount: {}, took: {} μs}", region, searcher.getIOCount(), cost);return region;} catch (Exception e) {log.info("failed to search({}): ", ip, e);}return null;// 3、备注:并发使用,每个线程需要创建一个独立的 searcher 对象单独使用。}public static void main(String[] args) throws Exception {getCityInfoByFile("111.0.72.130");}

输出:
在这里插入图片描述

5.2.4 缓存 VectorIndex 索引,对用户ip地址进行转换

我们可以提前从 xdb 文件中加载出来 VectorIndex 数据,然后全局缓存,每次创建Searcher 对象的时候使用全局的 VectorIndex 缓存可以减少一次固定的 IO 操作,从而加速查询,减少 IO 压力。

    /*** 获取ip属地(缓存 VectorIndex 索引)* @param ip IP地址* @return 返回地址*/public static String getCityInfoByVectorIndex(String ip) {String dbPath = "D:\\gitProject\\workRecord\\src\\main\\resources\\ip\\ip2region.xdb";// 1、从 dbPath 中预先加载 VectorIndex 缓存,并且把这个得到的数据作为全局变量,后续反复使用。byte[] vIndex;try {vIndex = Searcher.loadVectorIndexFromFile(dbPath);} catch (Exception e) {log.error("failed to load vector index from `{}`: ", dbPath, e);return null;}// 2、使用全局的 vIndex 创建带 VectorIndex 缓存的查询对象。Searcher searcher;try {searcher = Searcher.newWithVectorIndex(dbPath, vIndex);} catch (Exception e) {log.error("failed to create vectorIndex cached searcher with `{}`: ", dbPath, e);return null;}// 3、查询try {long sTime = System.nanoTime();String region = searcher.search(ip);long cost = TimeUnit.NANOSECONDS.toMicros(System.nanoTime() - sTime);log.info("{region: {}, ioCount: {}, took: {} μs}\n", region, searcher.getIOCount(), cost);return region;} catch (Exception e) {log.error("failed to search({}): ", ip, e);}return null;// 备注:每个线程需要单独创建一个独立的 Searcher 对象,但是都共享全局的制度 vIndex 缓存。}public static void main(String[] args) throws Exception {getCityInfoByVectorIndex("111.0.72.130");}

输出:
在这里插入图片描述

5.2.5 缓存整个 xdb 数据,对用户ip地址进行转换

我们也可以预先加载整个 ip2region.xdb 的数据到内存,然后基于这个数据创建查询对象来实现完全基于文件的查询,类似之前的 memory search。

    /*** 获取ip属地(缓存整个 xdb 数据)* @param ip IP地址* @return 返回地址*/public static String getCityInfoByMemorySearch(String ip) {String dbPath = "D:\\gitProject\\workRecord\\src\\main\\resources\\ip\\ip2region.xdb";// 1、从 dbPath 加载整个 xdb 到内存。byte[] cBuff;try {cBuff = Searcher.loadContentFromFile(dbPath);} catch (Exception e) {log.error("failed to load content from `{}`: ", dbPath, e);return null;}// 2、使用上述的 cBuff 创建一个完全基于内存的查询对象。Searcher searcher;try {searcher = Searcher.newWithBuffer(cBuff);} catch (Exception e) {log.error("failed to create content cached searcher: ", e);return null;}// 3、查询try {long sTime = System.nanoTime();String region = searcher.search(ip);long cost = TimeUnit.NANOSECONDS.toMicros(System.nanoTime() - sTime);log.info("{region: {}, ioCount: {}, took: {} μs}\n", region, searcher.getIOCount(), cost);} catch (Exception e) {log.error("failed to search({}): ", ip, e);}return null;// 备注:并发使用,用整个 xdb 数据缓存创建的查询对象可以安全的用于并发,也就是你可以把这个 searcher 对象做成全局对象去跨线程访问。}public static void main(String[] args) throws Exception {getCityInfoByMemorySearch("111.0.72.130");}

输出:
在这里插入图片描述

6 总结

根据IP地址获取对应归属地的介绍就到这了,有问题的小伙伴们可以在评论区讨论


http://chatgpt.dhexx.cn/article/oQZ9dd4K.shtml

相关文章

L58.linux命令每日一练 -- 第九章 Linux进程管理命令 -- pgrep和kill

9.3 pgrep&#xff1a;查找匹配条件的进程 9.3.1 命令详解 ​ 【命令星级】 ★★★★☆ ​ 【功能说明】 ​ pgrep命令可以查找匹配条件的进程号。 ​ 【语法格式】 pgrep [option] [pattern] pgrep [选项] [匹配添加]​ **说明&#xff1a;**在pgrep命令及后面的选项和匹…

Linux命令之查找进程pgrep

概述 pgrep命令是通过名称从运行进程队列中查找进程&#xff0c;并且显示查找到的进程ID。 如果我们想要查找正常运行的java进程&#xff08;通常是tomcat进程&#xff09;&#xff0c;那么可以使用如下语句&#xff1a; ps -ef | grep java | grep -v grep | gawk -n {prin…

linuxpgrepgrep_Linux pgrep与kill的使用

想结束系统中指定的进程&#xff0c;有以下指令可能参考&#xff1a; ps -ef | grep pure-ftpd | grep -v grep | awk {print $2" "$3} | xargs kill -9 pkill pure-ftpd killall -9 nginx 或者 kill -9 ps aux |grep -i nginx |grep -v grep |awk {print $2} kill…

linux 命令 pgrep

linux查看服务pid pgrep是一个命令行实用程序&#xff0c;根据给定的条件查找正在运行的程序的进程id。它可以是完整的或部分的进程名、运行该进程的用户或其他属性。 语法&#xff1a; pgrep [options] pattern 当在没有任何选项的情况下调用时&#xff0c;pgrep将显示与给…

linux查看进程pgrep,查看进程PID专用工具-------pgrep

一、Linux命令pgrep简单介绍 pgrep是linux中常用的通过程序名称来查询进程的工具&#xff0c;一般是用来判断程序是否正在运行及查找正在运行进程的PID信息。通过pgrep命令&#xff0c;可以只指定进程的一部分名称从运行进程队列中进行查看进程的PID信息&#xff0c;但只输出PI…

linux shell pgrep命令使用方法(pgrep指令)获取进程号、统计进程数量(学会区分Linux进程进程名)

文章目录 问题背景pgrep指令help文档使用示例1. 列出匹配进程的PID和进程名称&#xff08;-l&#xff09;&#xff08;默认只能从进程名的子集字符串匹配&#xff0c;如果要使用完整进程名的子集字符串匹配&#xff0c;请加-f参数&#xff0c;下同&#xff09;2. 列出匹配进程的…

pgrep

Pgrep 用于根据进程的name查找进程的pid。例如&#xff1a;

Linux pgrep命令

1 pgrep pgrep是一个根据名称查找进程ID的命令&#xff0c;返回的是进程ID&#xff0c;若存在当个进程&#xff0c;则分为不同的行返回ID&#xff08;默认实现&#xff09;。 2 示例 查找java进程&#xff1a; pgrep java上图还显示了ps与pgrep的区别&#xff0c;简单来说&…

【笔记11】个人扫盲:内存与CPU中的核、线程、物理CPU、逻辑CPU

文章目录 CPU与内存CPU内存什么是通道常见问题 物理CPU和逻辑CPU常见问题LINUX查看WINDOW查看 CPU与内存 CPU CPU&#xff08;Central Processing Unit&#xff09;即中央处理器。CPU从内存&#xff08;Memory&#xff09;或缓存&#xff08;Cache&#xff09;中取出指令&…

Linux下区分物理CPU、逻辑CPU和CPU核数

一、概念 ① 物理CPU 实际Server中插槽上的CPU个数 物理cpu数量&#xff0c;可以数不重复的 physical id 有几个 ② 逻辑CPU Linux用户对 /proc/cpuinfo 这个文件肯定不陌生. 它是…

记录一个有意思的cpu逻辑cpu核数问题(已解决)

top命令查看逻辑cpu个数的时候发现只有20个 实际上服务器的的逻辑cpu个数是32个 物理cpu核数 PS&#xff1a;该问题也存在于部分新旧服务器上&#xff0c;网上没找到答案&#xff0c;特此记录。希望未来可以得到答案。 2021年09月27日更新 目前认为最近用到了多少cpu核数就显…

物理CPU,物理CPU内核,逻辑CPU概念详解

1.说明 CPU(Central Processing Unit)是中央处理单元&#xff0c; 本文介绍物理CPU&#xff0c;物理CPU内核&#xff0c;逻辑CPU&#xff0c; 以及他们三者之间的关系&#xff0c; 一个物理CPU可以有1个或者多个物理内核&#xff0c; 一个物理内核可以作为1个或者2个逻辑CPU。 …

Linux下区分物理CPU、逻辑CPU、CPU核数、线程数以及查看命令

概念 ① 物理CPU 实际服务器中插槽上的CPU个数 是指物理上&#xff0c;也就是硬件上存在着几颗物理cpu,指的是真实存在是cpu处理器的个数&#xff0c;1个代表一颗&#xff0c;2个代表2颗cpu处理器。 物理cpu数量&#xff0c;可以数不重复的 physical id 有几个 ② 逻辑CPU Lin…

linux服务器的物理CPU,CPU核数,逻辑CPU及Hadoop的Vcore

linux服务器的物理CPU&#xff0c;CPU核数&#xff0c;逻辑CPU及Hadoop的Vcore 1、Linux服务器的核数的概念 物理CPU&#xff1a; 服务器上真实存在的CPU&#xff0c;可以看到 CPU的核 (core)&#xff1a; 一个CPU上包含多少核(core)&#xff0c;真实存在但不能直接看到 总核数…

CPU 主频,核数 参数解读 物理CPU,逻辑CPU,物理核 概念辨析

Q1&#xff1a; CPU高主频好还是多核数好&#xff1f; 游戏需求 如果是主打游戏&#xff0c;由于游戏需要的是最简单粗暴的计算工作&#xff0c;这方面多核心有点无用武之地。因此&#xff0c;目前主流游戏都是双核心调用&#xff0c;四核或者更多核心的比较少。 也就是说&…

物理CPU-Core-逻辑CPU -超线程

原文地址&#xff1a; http://www.daniloaz.com/en/differences-between-physical-cpu-vs-logical-cpu-vs-core-vs-thread-vs-socket/ 水平所限&#xff0c;翻译不准确的地方望指正。 当我们使用像 nproc或者 lscpu等命令 来在CPU级别上获取计算机的架构和性能的时候&#xf…

【Pytorch】物理cpu、逻辑cpu、cpu核数、pytorch线程数设置

上周末写ddp&#xff0c;常常遇到中途退出的问题&#xff0c;解决中途遇到了很多CPU线程数和核心数的问题&#xff0c;记录如下 1. 物理cpu、逻辑cpu、cpu核数、超线程 这一部分主要来自什么是物理cpu&#xff0c;什么是逻辑cpu&#xff0c;什么cpu核数&#xff0c;什么是超线…

Linux下关于物理CPU、逻辑CPU和CPU核数、超线程

1、概念 &#xff08;1&#xff09; 【物理CPU数】 &#xff1a;实际Server中插槽上的CPU个数&#xff0c;物理cpu数量可以数不重复的 physical id 有几个 &#xff08;physical id&#xff09; &#xff08;2&#xff09; 【CPU核数】&#xff1a;单块CPU上面能处理数据的芯…

物理CPU,CPU核数,逻辑CPU

CPU概念 物理CPU 在Info中由physical id识别 物理CPU指的是实际主板上插槽上的CPU个数。physical id 就是每个物理CPU的ID&#xff0c;不重复的 physical id 有几个&#xff0c;物理cpu数量就是几个。 CPU核数&#xff08;物理核&#xff09; 在Info中由 cpu cores 识别 CPU核…

物理cpu数,逻辑cpu数,cpu核数

一、物理CPU数 机器的主板上实际插入插槽的CPU个数。 二、CPU核数 单块CPU上面集成一个或者多个处理器芯片(称为Core&#xff0c;核心)。 CPU最初发展的时候是一个CPU一个处理核心&#xff0c;CPU的性能主要靠提高核心工作频率来提高&#xff0c;但是仅仅提高单核芯片的速度…