当前位置：首页 > 滚动 > >正文

大文件上传功能在标签服务的简单应用和代码实现世界热文

来源：博客园时间：2023-06-14 14:14:24

各位看官大家好，今天给大家分享的又是一篇实战文章，希望大家能够喜欢。

目前「袋鼠云客户数据洞察平台」标签服务的群组按种类划分，可以分为三大类，分别是实时群组、动态群组以及静态群组。如果按创建方式划分则有两种，分别是通过圈群的方式创建以及通过上传本地文件进行维度匹配的方式创建得到本地群组，其中本地群组属于静态群组。

除了本地群组外的其他群组目前都是采用圈群的方式生成匹配 SQL，然后执行相应的 SQL 得到相应查询维度的数据并入库到群组表，这种方式比较方便，可以快速得到一个用户期望的群组。

(资料图片)

但是有那么一种场景，假设想要设置的条件很分散，通过圈群配置的时候比较复杂，那么只能通过上传文件的方式进行匹配，这就需要用户上传本地文件，通过指定匹配维度的方式来生成本地群组。

如果用户上传的本地文件很小，那么比较简单，按单个文件直接上传解析即可。如果用户上传的文件很大，有50M，那么就需要采用分片的方式进行上传，本文和大家分享一下这两种文件上传的代码实现。

小文件上传的实现

小文件上传的主要流程包括将文件上传到服务器，并获得文件的编码格式，文件上传完毕后，异步解析文件并得到本地群组。

将文件上传到 HDFS 并保存原始文件到 SFTP，上传到 HDFS 之后，通过 SQL 来与实体对应的大宽表进行数据匹配，最终生成本地群组。

小文件直接上传即可，代码如下，上传完成后，获取文件的编码格式，用于后续的文件解析。

大文件上传的实现

前端将大文件按指定大小分片，并计算原始文件的 md5 和每个分片文件的 md5，分别用于文件校验以及分片文件断点续传。接口入参代码设计如下：

大文件分片实现部分核心代码如下：

分片文件重新在服务器整合为一个大文件的整体代码如下：

单个分片的数据接收并写入代码如下：

当检测到上传的文件是最后一个分片文件的时候，待分片数据写入完成后，需要对服务器上的文件进行 md5 校验来保证文件数据的一致性。

当文件上传到服务器完成后，需要将文件上传到 HDFS 以及SFTP，代码如下：

最终得到的本地群组如下：

《数栈产品白皮书》：https://www.dtstack.com/resources/1004?src=szsm

《数据治理行业实践白皮书》下载地址：https://www.dtstack.com/resources/1001?src=szsm

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友，浏览袋鼠云官网：https://www.dtstack.com/?src=szbky

同时，欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术qun」，交流最新开源技术信息，qun号码：30537511，项目地址：https://github.com/DTStack

X 关闭

最近更新

大文件上传功能在标签服务的简单应用和代码实现世界热文

2023-06-14 14:14:24

滚动
北京土拍：海淀2宗地块线上触顶总成交价98.9亿元

2023-06-14 13:10:51

滚动
【全球新要闻】点球成金mp4_点球成金迅雷下载

2023-06-14 12:56:50

滚动
全球消息！6月17日前申报!甘肃定西市安定区开展50MW集中式光伏发电项目竞争性配置申报工作

2023-06-14 12:19:12

滚动
2023邹城清凉一夏餐饮消费券发放时间及有效期一览表全球速递

2023-06-14 11:46:54

滚动
《极限竞速8》公布4K/60帧新实机展示新模式与玩法

2023-06-14 11:07:18

滚动
每日看点！公告速递：上银政策性金融债债券基金暂停大额申购、转换转入及定期定额投资业务

2023-06-14 10:40:35

滚动
要闻：亲近乌梁素海

2023-06-14 10:14:04

滚动
blv转换成mp3_blv转mp4格式转换器

2023-06-14 09:47:54

滚动
世界观点：解码文化自信的城市样本｜见证开埠历史 “重庆最早洋行”获新生

2023-06-14 09:21:10

滚动
创业板新股致欧科技中签号码公布，快来看看吧！全球独家

2023-06-14 09:03:23

滚动
世界热议:曹洞正宗开山始祖碧海公支派普同宝塔（关于曹洞正宗开山始祖碧海公支派普同宝塔介绍）

2023-06-14 08:15:58

滚动
曝光地铁大叔，霸凌室友，威逼实习公司隐藏信息，张某恶行惹人怒-环球滚动

2023-06-14 07:40:33

滚动
EDG对战IG首发出炉！Uzi在列上次复出首场也是打IG

2023-06-14 06:37:24

滚动
特别提醒，事关西安2023年中考

2023-06-14 05:30:34

滚动
土家族的传统节日风俗作文_土家族的传统节日

2023-06-14 01:59:15

滚动
【环球新视野】yi开头的成语_以开头的成语

2023-06-13 23:05:44

滚动
辩证法思想_关于辩证法思想的介绍全球报资讯

2023-06-13 21:57:55

滚动
环球观察：[快讯]广联航空:关于董事、高级管理人员股份减持计划终止

2023-06-13 21:06:40

滚动
两寸电子照片像素_两寸照片多大像素简讯

2023-06-13 20:17:16

滚动
Ubisoft新作《阿凡达：潘朵拉边境》公开新预告，将于12月7日推出

2023-06-13 19:44:17

滚动
【独家】蔚来号召员工为车主献血称“伙伴们都在积极报名”

2023-06-13 18:51:56

滚动
黑龙江省2023年高考申请享受政策性照顾项目的考生名单公示

2023-06-13 18:19:10

滚动
瑞鹄模具：宏博科技减持可转换公司债券约36万张

2023-06-13 18:02:43

滚动
谈心谈话记录内容一对一2023组织生活会（谈话的近义词吩咐的近义词）-环球即时

2023-06-13 17:25:47

滚动
央行：5月末社会融资规模存量为361.42万亿元同比增长9.5%

2023-06-13 16:48:16

滚动
几何决斗什么时候出公测上线时间预告今日要闻

2023-06-13 16:31:14

滚动
【风口解读】存储芯片概念活跃，香农芯创冲高回落，机构看好估值底部复苏预期当前消息

2023-06-13 16:01:38

滚动
丁俊晖名利双收成最大赢家！中国一哥的职业生涯已近乎完美！

2023-06-13 15:21:34

滚动
能链智电收购香港光电89.99%股权

2023-06-13 14:46:04

滚动
【全球速看料】在广东360分能考进哪些大学高可以读什么上什么

2023-06-13 14:11:05

滚动
比亚迪香港4间门店遭泼红漆、撞闸门！代理商称并非一般寻仇_全球球精选

2023-06-13 13:52:51

滚动
央行降息发力稳增长，房贷利率有望下调|全球观察

2023-06-13 12:48:36

滚动
侍魂零特别版下载（侍魂零和侍魂零特别版

2023-06-13 12:02:35

滚动
股东提出解散应提交的证据_每日速看

2023-06-13 11:41:03

滚动
环球时讯：环世界1.0精心准备mod（精心准备近义词）

2023-06-13 11:23:25

滚动
焦点快报!科创板开板四周年：硬科技作底色为科创企业撑起一片天

2023-06-13 10:46:50

滚动
焦点简讯:C罗、梅西和本泽马，都是背后推手！姆巴佩不续约，巴黎态度强硬

2023-06-13 10:27:06

滚动
万润科技：坚持市场引领、创新驱动，发展半导体电子业务

2023-06-13 10:06:18

滚动
山西多地遭遇冰雹袭击|天天热点评

2023-06-13 09:49:29

滚动
年内18家公司已触及“1元退市”红线花式“保壳”难改被“淘汰”命运

2023-06-13 09:15:30

滚动
为了传承非遗“宛梆”，武翠亭在37岁时考进大学......|焦点速递

2023-06-13 08:40:08

滚动
签字章是否视为本人签字废标_签字章快播

2023-06-13 08:01:05

滚动
桓仁县气象局发布雷电黄色预警【Ⅲ级/较重】【2023-06-13】_世界资讯

2023-06-13 06:51:09

滚动
利爪尤里安坦率_利爪尤里安-热点

2023-06-13 05:53:51

滚动
输送带过高，进站安检搬运大件行李很吃力？上海地铁回应

2023-06-13 04:58:05

滚动
邓紫棋好听的粤语歌推荐_邓紫棋好听的粤语歌世界微动态

2023-06-13 03:47:30

滚动
快资讯：5-0！中国女足五人进球，邹梦瑶低迷，球迷很失望

2023-06-13 01:07:47

滚动
哈纳斯打通宁夏绿色能源保供输气“高速公路”|微动态

2023-06-12 22:46:12

滚动
乡政府院内可以晒粮！

2023-06-12 21:55:28

滚动
八角的功效与作用禁忌与副作用有哪些_八角的功效与作用禁忌

2023-06-12 20:51:11

滚动
【环球新要闻】蘑菇肉馅冷冻一周后能否食用?要注意什么?

2023-06-12 20:00:59

滚动
外交部：邢海明大使同韩各界人士广泛接触交流是其职责所在-世界观热点

2023-06-12 19:44:03

滚动
中牟县林业局开展“党建聚合力共建促发展”主题党日活动

2023-06-12 18:36:15

滚动
【肖春生X佟晓梅】《种花》（一）每日焦点

2023-06-12 18:03:29

滚动
攀岩动作冒险新作《JUSANT》预告片公布今年秋发售|当前热议

2023-06-12 17:00:57

滚动
最新消息：紫荆文化集团发布系列重点文化项目

2023-06-12 16:11:43

滚动
汤阴一中2022分数线（汤阴一中）焦点播报

2023-06-12 15:22:03

滚动
全球快讯:躲在角落不见人是什么生肖和数字（躲在角落不见人是什么生肖）

2023-06-12 14:09:04

滚动
亚运征途英雄联盟项目中国代表队公布：WE全队参赛每日速讯

2023-06-12 13:09:49

滚动
新能源汽车下乡，重在满足需求（评论员观察）

2023-06-12 12:14:42

滚动
进度过七成半全国冬小麦收获2.39亿亩_新要闻

2023-06-12 11:01:39

滚动
年轻人读书新方式，写满了他们热爱的生活

2023-06-12 10:06:19

滚动
警民联手救助被困雪豹全球看点

2023-06-12 09:05:03

滚动
苹果刚刚发布的重磅新品，居然和华为“撞车”了？|全球要闻

2023-06-12 05:21:58

滚动
天津积分落户要无犯罪记录证明吗_天津积分落户要多少分

2023-06-11 23:42:25

滚动
林定国：争取港资港法措施扩大至大湾区全域

2023-06-11 21:32:12

滚动
侠盗猎车手圣安地列斯秘籍攻略（侠盗猎车手圣安地列斯秘籍大全招小弟）_天天新资讯

2023-06-11 20:51:04

滚动
河南：关于做好2023年军队院校招收普通高中毕业生政治考核工作的通知

2023-06-11 19:58:42

滚动
车上aux是什么意思_aux简单介绍-全球快看点

2023-06-11 19:40:36

滚动
柳岩的衣服真“挤”，一袭抹胸连衣裙高级时髦，大方展现曼妙身姿

2023-06-11 18:58:34

滚动
汉阳陵博物院举办“文化和自然遗产日”活动

2023-06-11 18:13:47

滚动
环球快消息！英国前首相约翰逊宣布辞去议员职务声明“暂时”离开似乎暗示将重返政坛

2023-06-11 17:43:30

滚动
RK3588-CAN总线_实时焦点

2023-06-11 17:15:54

滚动
北京德云社地址门票（北京德云社地址）_每日视讯

2023-06-11 16:13:41

滚动
极目时评丨环卫母亲与高考儿子相拥而泣刷屏，普通人改变命运的努力打动人心-当前视讯

2023-06-11 16:08:31

滚动
每股收益无差别点的计算公式大债小股（什么是每股收益每股收益计算公式是什么）

2023-06-11 16:08:56

滚动
本报作品获第34届中国经济新闻奖一等奖

2023-06-11 15:10:13

滚动
环球播报:美国宪法最根本的原则（美国宪法的政治原则是什么）

2023-06-11 14:25:14

滚动
全球新动态：湖北省地方金融监督管理局党组书记、局长段银弟接受审查调查

2023-06-11 13:51:12

滚动
焦点要闻：推广共享用电新疆电力试点解决“短时用电大问题”

2023-06-11 13:18:51

滚动
广汽埃安副总经理：原来车厂不是为电池厂打工而是为材料厂打工且还是打长工_当前热文

2023-06-11 12:59:23

滚动
梅西不回，他却偷着乐！索3000万年薪＋提7大要求，球王错信了他

2023-06-11 12:09:27

滚动
每日热议!中超：武汉三镇平山东泰山

2023-06-11 12:09:09

滚动
【新要闻】新台两地自媒体人：用镜头架起两岸交流“心桥”

2023-06-11 11:43:47

滚动
快资讯丨汝州张公巷窑出土青瓷首次面向公众展出

2023-06-11 11:01:57

滚动
美国教授在水下生活100天后：“我的身体年轻了10岁”！_焦点快看

2023-06-11 10:41:46

滚动
未来两天陕西中南部有阵性降水

2023-06-11 10:13:25

滚动
每日速读!快评｜到底是不是“指鼠为鸭”？期待用令人信服的结论找回丢失的公信力

2023-06-11 09:29:22

滚动
游戏陪玩行业乱象调查：不少未成年接单，线下陪玩安全难保障

2023-06-11 09:17:53

滚动
游戏陪玩行业乱象调查：不少未成年接单，线下陪玩安全难保障

2023-06-11 09:14:21

滚动
尼基-巴特：每个人都知道曼联的领袖是滕哈赫，这一点很重要

2023-06-11 08:41:11

滚动
丹麦男子10年访遍全球每个国家，不坐飞机，行程36万公里-观速讯

2023-06-11 08:33:52

滚动
今日播报!魔兽地图僵尸岛3攻略（魔兽地图僵尸岛6 0）

2023-06-11 07:43:58

滚动
相术小说神作（相术小说）

2023-06-11 07:15:54

滚动
中建科工到柳州融水大苗山开展爱心助学志愿活动

2023-06-11 06:53:07

滚动
天天视讯！名师工作室个人工作总结精选文档.docx

2023-06-11 06:25:30

滚动
天天热讯:高腰紧身牛仔裤，时髦又百搭，搭配黑色吊带，显得身姿曼妙

2023-06-11 06:17:57

滚动
买房送黄金的杭州拍地又热爆了！70家房企摇号创新高，滨江、绿城“暗战”

2023-06-11 04:58:44

滚动
中国死海盐湖旅游区_中国死海天天热讯

2023-06-11 04:24:31

滚动

大文件上传功能在标签服务的简单应用和代码实现 世界热文

小文件上传的实现

大文件上传的实现

推荐内容

最近更新

大文件上传功能在标签服务的简单应用和代码实现世界热文