大数据流量分析系统

article/2025/9/21 3:58:46

大数据流量分析系统

前几天去了移动营业厅办了个卡,就不说某动的内幕了,说说上行流量和下行流量统计手机号码的总流量。这次我们利用大数据来分析,大数据也有三大框架,Hadoop是离线计算框架,Storm是实时计算框架,Spark是内存计算框架。这里我们使用Hadoop,因为已经有流量的数据,只需统计出来就可以了。

首先我们没有移动的真实数据,只能伪造数据。
这里写图片描述
之前做了个excel生成数据的系统,这里生成了手机号,32位随机码,上行流量,下行流量,状态码。

map.put("CODEA", "131"+_stringUtils.getCharAndNumr(8, 1));map.put("CODEB", _stringUtils.getRandomName());map.put("CODEC", _stringUtils.getCharAndNumr(3, 1));map.put("CODED", _stringUtils.getCharAndNumr(4, 1));map.put("CODEE", "200");

1、用java生成excel文件,再复制转成log文件,数据如下:
这里写图片描述
2、再上传到hdfs中
由于使用windows测试,hadoop环境是安装在windows上。
想学习大数据,又觉得在linux上难操作的,可加QQ490647751,获取windows-hadoop文件资料,只要修改自己的jdk,hadoop环境,一键打开hadoop,网页运行localhost:8088和locahost:50070即可。

想学习大数据的童鞋,多关注本博客,谢谢!

final FSDataOutputStream out = fileSystem.create(new Path(FILE));final FileInputStream in = new FileInputStream("D:/HTTP0804.logs");IOUtils.copyBytes(in, out, 1024, true);

// 将D盘中的HTTP0804.logs文件上传到hdfs中的FILE路径中

3、用hadoop计算生成文件

@Overrideprotected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, FlowBean>.Context context)throws IOException, InterruptedException {//1、接受数据String line = value.toString();//2、数据切片String[] fields = line.split("\t");//3、拿到关键字段String phoneStr = fields[0];long upFlow = Long.parseLong(fields[fields.length - 3]);long dfFlow = Long.parseLong(fields[fields.length - 2]);//4、数据输出到reduce阶段context.write(new Text(phoneStr), new FlowBean(upFlow, dfFlow));}
@Overrideprotected void reduce(Text key, Iterable<FlowBean> values, Reducer<Text, FlowBean, Text, FlowBean>.Context context)throws IOException, InterruptedException {//初始化求和变量long sum_upFlow = 0;long sum_dfFlow = 0;//遍历累加求和for(FlowBean b:values){sum_upFlow += b.getUpFlow();sum_dfFlow += b.getDfFlow();FlowBean result = new FlowBean(sum_upFlow, sum_dfFlow);context.write(key, result);}}
hadoop jar flow0804.jar com.yanhui.hadoop.FlowLogsCount /yanhui/in /yanhui/out

4、下载该文件
这里写图片描述
从图上看,手机号,上行流量,下行流量,总流量这样输出。

获取源码学习,可点击下载:http://47.98.237.162/detail/1/169


http://chatgpt.dhexx.cn/article/WbTQQujj.shtml

相关文章

使用流量分析系统进行资产梳理

很多网络管理人员都接触资产梳理&#xff0c;也有很多软件和系统附带资产梳理工具&#xff0c;但是根据明辰智航统计&#xff0c;很多企事业单位资产梳理工作是以前进行的&#xff0c;没有及时更新。网络管理人员甚至不了解企业网络中有多少个MAC地址、IP地址、端口、协议、应用…

网络异常流量分析系统设计

为什么要监测分析异常流量&#xff1f; 网络管理人员都希望在网络性能突然下降的时候找到“真凶”所在&#xff0c;并迅速解决问题。利用网络异常流量监测的方法&#xff0c;可以非常直观地看到网络流量是否有突然增长或者突然下降的现象&#xff0c;并进一步分析是那些用户产…

国内首个开源网络流量可视化分析平台 -- 流影

流影:基于流量的网络行为高级分析平台 流影是一款基于全流量的高级网络行为分析平台,该系统是由深海鱼(北京)科技有限公司流影项目组研发设计,首发开源是1.0版本。 项目简介 深海鱼(北京)科技有限公司专注于为客户提供优质的数据分析相关服务,近年来立足于客户的数字安…

大数据综合项目--网站流量日志数据分析系统(详细步骤和代码)

文章目录 前言&#xff1a;基本概述Sqoop概述什么是Sqoop Flume概述什么是Flume为什么需要flume HIve概述什么是Hive 系统背景&#xff1a;模块开发数据采集使用Flume搭建日志采集系统 数据预处理实现数据预处理 数据仓库开发数据导出日志分析系统报表展示 前言&#xff1a; 提…

实战演习(四)——网络流量系统分析简介

笔者是一个痴迷于挖掘数据中的价值的学习人&#xff0c;希望在平日的工作学习中&#xff0c;挖掘数据的价值&#xff0c;找寻数据的秘密&#xff0c;笔者认为&#xff0c;数据的价值不仅仅只体现在企业中&#xff0c;个人也可以体会到数据的魅力&#xff0c;用技术力量探索行为…

网络流量在线分析系统的设计与实现

编译环境&#xff1a;visual studio2019&#xff0c;安装并配置winpcap和pthreads库函数 1 配置环境 1.1 安装vscode 参考微信公众号 软件安装管家。 1.2 安装MinGW-w64 下载地址&#xff1a;添加链接描述 安装参考博客&#xff1a;MinGW-w64安装配置全过程 第一步&#xf…

时间范围查询

开发工具与关键技术&#xff1a; VS,条件查询 作者&#xff1a;卢惠圳 撰写时间&#xff1a;2019年8月16日 在页面的表格数据中会有要根据时间来作为查询条件的数据&#xff0c;一般是根据时间范围来进行查询所以这里也是时间范围的查询&#xff0c;先将表格和进行时间范围查询…

oracle语句查询时间范围

oracle语句查询时间范围 参考网址 &#xff1a; https://blog.csdn.net/weixin_36436373/article/details/116541220?ops_request_misc%257B%2522request%255Fid%2522%253A%2522167930069316800188562500%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%25…

VUE时间范围选择的组件

最近手写了一个框选时间的组件,可以按半个小时为单位选择时间 代码部分 <template><div><div class"byted-schedule"><table :key"itemKey" class"byted-schedule-calendar-table"><thead><tr><th rows…

Mysql获取指定时间范围数据

MySQL获取某个时间范围内的数据 TO_DAYS(date)函数。 to_days()&#xff1a;返回从0000年至当前日期的总天数。 目录 1、今天(TO_DAYS()) 2、今天昨天(TO_DAYS()) 3.近7天(DATE_SUB()) 5.本月(DATE_FORMAT()) 6.上一月(PERIOD_DIFF()) 7.本季度 8.上季度 9.本年 ​1…

Mybatis-Plus时间范围查询

方式一 通过apply方法&#xff0c;来实现时间范围查询&#xff0c;该方法可用于数据库函数&#xff0c;动态入参的params对应前面applySql内部的{index}部分&#xff0c;这样是不会有sql注入风险的&#xff0c;反之会有! apply(String applySql, Object... params) apply(boo…

elementui DateTimePicker组件 限制时间范围(包含时分秒)

1、基础范围控制&#xff08;只控制日期&#xff0c;不含时分秒&#xff09; <template><el-date-pickertype"datetime"v-model"startDate"value-format"yyyy-MM-dd HH:mm:ss"placeholder"选择开始时间"size"mini"…

MongoDB查询某个时间范围

MongoDB 时间范围查询目前有两种方式&#xff1a; DateISODate MongoDB条件对应关系 (>) 大于 - $gt(<) 小于 - $lt(>) 大于等于 - $gte(< ) 小于等于 - $lte Date方式 例如查询时间段为2023.01.03<日期<2023.01.05可翻译为&#xff1a; "日期字段名&…

移动端时间范围选择

div模块 <div className"choseDate"><div className"range"><input classNamestartTime onClick{()>{this.setState({startVisible:true})}} placeholder"请选择开始日期" value{this.state.startTime} /><DatePickert…

sql查询时间范围数据

mapper.xml >查询一定时间范围 条件:年月日 时分秒 <if test"creatAt ! null and creatAt ! "><![CDATA[and DATE_FORMAT(ride_order.created_at, %Y-%m-%d %h-%m-%s)> DATE_FORMAT(#{creatAt}, %Y-%m-%d %h-%m-%s) ]]></if><if test&qu…

JAVA判断当前时间在时间范围内

我们在日常开发的时候肯定有围绕时间选择的一些功能, 今天给大家分享一个java如何判断当前时间是否在所选择时间范围内的一个小demo public static void main(String[] args) throws ParseException {SimpleDateFormat ft new SimpleDateFormat ("yyyy-MM-dd hh:mm:ss&q…

JavaScript 时间范围

当前时间往前的时间范围&#xff08;六个月之前&#xff09; 效果图 js文件代码片 /*查询日期区间&#xff08;当前时间往前&#xff09; Add By Vivian 2020/12/04 */ //rangeVal:两个日期的间隔符 num&#xff1a;隔多少 timeType&#xff1a;相隔时间类型 function funGet…

JavaScript如何判定一个给定的时间区间在哪些时间段范围内?

作者 | 十方 来源 | https://segmentfault.com/a/1190000041958661 有这样的一个场景&#xff1a;给定一个时间区间&#xff0c;需要判定这个时间区间在哪些时间段范围内. 比如时间段范围如下&#xff1a; [["00:00","01:00"],["01:00","02…

Impala-shell命令参数

文章目录 1. impala-shell外部命令2. impala-shell内部命令 1. impala-shell外部命令 所谓的外部命令指的是不需要进入到impala-shell交互命令行当中即可执行的命令参数。impala-shell后面执行的时候可以带很多参数。你可以在启动 impala-shell 时设置&#xff0c;用于修改命令…

Impala和Hive的关系(详解)

Impala和Hive的关系 Impala是基于Hive的大数据实时分析查询引擎&#xff0c;直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。并且impala兼容Hive的sql解析&#xff0c;实现了Hive的SQL语义的子集&#xff0c;功能还在不断的完善中。 Hive hi…