大数据需求分析_大数据平台需求

大数据需求分析_大数据平台需求学习思路: 1.需求是什么? 2.方案是什么? 3.逻辑是什么? 4.开发中的问题?怎么解决? 整体流量概况: 1.累计用户量 2.每日新增用户量 3.每日的访问人数、次数 4.每日的全部访问人均次数

大数据需求分析

 

学习思路:

1.需求是什么?

2.方案是什么?

3.逻辑是什么?

4.开发中的问题?怎么解决?

 

 

整体流量概况:

1.累计用户量

2.每日新增用户量

3.每日的访问人数、次数

4.每日的全部访问人均次数、时长和深度

5.计算用户平均会话数

6.计算当日访问IP数

7.新老用户访问占比

8.每日新老用户分布情况

9.每日新老用户在各个省下的分布

10.每个页面访问次数分布

11.每个版本的使用情况

12.访问终端(app、web、小程序)分布情况

 

 

用户获取:

新增用户量=自然流量+渠道流量

渠道新增用户量

各个渠道新用户人均使用时长

各个渠道的新用户转化率

异常流量分析

 

用户特征:

按地区(省市区)、性别、操作系统、注册时间、浏览器(Chrome、IE、FireFox)

版本的访问的流量分析

不同版本的人均使用时长

各个版本留存

 

事件转化:

新老用户事件发生次数、人数、人均次数

事件次数分段分布(0~1)(1~10)(10~50)

 

 

技术选型:

1.数据量大小

2.业务需求

3.行业内的经验

4.技术成熟度

5.开发维护成本

6.总成本预算

 

组件版本选择:

1.不要选择最新的版本

2.最新版本半年前左右的稳定版

3. 3.1.1 3.1.2 3.2

 

物理机:

128G 20c 40T 8THHD 2TSSD 4W

人、电、物理机:5w

 

集群服务分配:

1.负载均衡

2.保证服务依赖关系尽可能在同一台节点上

数仓部署和理解,hive管理

大数据需求分析_大数据平台需求

 

 

 大数据需求分析_大数据平台需求

 

大数据需求分析_大数据平台需求

 

 大数据需求分析_大数据平台需求

 

 大数据需求分析_大数据平台需求

 

 大数据需求分析_大数据平台需求

 

 大数据需求分析_大数据平台需求

 

 大数据需求分析_大数据平台需求

 

 大数据需求分析_大数据平台需求

 

 大数据需求分析_大数据平台需求

 

 

原文地址:https://www.cnblogs.com/flyer-ovo/archive/2022/11/24/16921421.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/4505.html

(0)
上一篇 2023-06-16
下一篇 2023-06-16

相关推荐

  • Python自定义异常详解

    Python自定义异常详解在Python中,异常(Exception)是一种标准的处理错误或异常情况的方式。然而,Python也支持用户自定义异常。自定义异常可以为程序带来更详细、更具体的信息,有助于开发者在程序出错时更快地找到问题所在。本文将介绍Python中自定义异常相关的知识。

    2024-08-24
    27
  • 使用pip卸载Python包的方法

    使用pip卸载Python包的方法Python是一种流行的编程语言,它拥有大量的包和库可以让程序员们使用。在开发过程中,我们经常需要添加或删除某些包或库。而pip是Python的包管理器,它通常用于安装和卸载Python包。在这篇文章中,我们将介绍如何使用pip来卸载Python包。

    2024-08-07
    30
  • 使用 yum 在 CentOS7 上安装 MySQL8

    使用 yum 在 CentOS7 上安装 MySQL8时间:2022-07-13 安装版本:MySQL-community-8.0.29 0. 删除MariaDB 在CentOS 7中默认有安装MariaDB,这个是MySQL的分支,通过其他方式安装My

    2023-05-25
    150
  • MySQL是如何实现事务的隔离级别「建议收藏」

    MySQL是如何实现事务的隔离级别「建议收藏」摘要 本文旨在了解MySQL InnoDB引擎如何支持事务的隔离级别。 文章主要内容分两个部分。 第一部分阐述数据库的并发问题以及为之产生的ANSI SQL 标准隔离级别。 第二部分根据 MySQL

    2023-03-04
    148
  • MySQL乱码问题[通俗易懂]

    MySQL乱码问题[通俗易懂]1 概述 乱码问题,除了编码不对应应该没有别的原因了。可以先查看一下自己的编码,进行MySQL命令行,使用 status; 或 show variables like '%char%&ap…

    2023-03-01
    161
  • 数据库脏读怎么解决_数据库事务的隔离等级为重复读

    数据库脏读怎么解决_数据库事务的隔离等级为重复读面试的时候碰到了此类问题,此前认知一直模棱两可,特在此重新学习总结一下: 1、脏读:指当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,…

    2022-12-23
    161
  • Python os.sep:如何更好地处理文件路径

    Python os.sep:如何更好地处理文件路径在Python中处理文件和文件夹路径是非常常见的操作,但由于不同操作系统的不同,使用正确的文件路径分隔符是无可厚非的。Python的os模块提供了os.sep参数来解决这个问题。本文将从多个方面介绍Python os.sep的使用方法。

    2023-12-31
    117
  • 李呈祥:bilibili在湖仓一体查询加速上的实践与探索[通俗易懂]

    李呈祥:bilibili在湖仓一体查询加速上的实践与探索[通俗易懂]导读: 本文主要介绍哔哩哔哩在数据湖与数据仓库一体架构下,探索查询加速以及索引增强的一些实践。主要内容包括: 什么是湖仓一体架构 哔哩哔哩目前的湖仓一体架构 湖仓一体架构下,数据的排序组织优化 湖仓一

    2023-05-22
    139

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注