AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

Binom
 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理指纹浏览器,就用AdsPower
Mediabuy⚡️玩家开户首选【鲁班跨境通-自助充值转账】FB/GG/TT❤️官方免费开户Affiliate 全媒体流量资源⚡️
Taboola/Outbrain /Bing⚡️一级代理开户投流-7*24h❤️人工在线【官方】❤️搜索套利广告开户独立站⚡️开户投放
DuoPlus专注打造跨境电商云手机E.PN 虚拟卡BINOM TRACKER 60% OFF!比Adplexity还好用的Spy工具
MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量百度国际MediaGo,独家原生流量
ADPLEXITY + ADVERTCN7200W全球动态不重复住宅IP代理虚拟信用卡+独立站收款全球虚拟卡, 支持U充值
Facebook 批量上广告尤里改 - FB 稳定投放免费黑五教程(持续更新、欢迎交流)FB 三不限源头 - 自助下户充值转款
各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户一手BM分享户不限额9Proxy ⚡️ $0.04/IP, 无限带宽
FB二三解0.1元一个虚拟卡|PTM星际卡FB专用虚拟卡Google、Bing官方总代  联盟流量开户
FB账号资源/稳定靠谱/运行5年啦FB开户代投/三不限/白名单fb耐用号0.01一个fb账号官方合作商
搜索套利开户❤️Bigo/Kwai/MediagoFB资源,账单户,分享户,国内一手FB企业户BM户账单户源头广告位出租
查看: 8304|回复: 6

大数据分析手段精准营销spark技术

[复制链接]

5

主题

14

广告币

93

积分

初级会员

Rank: 2

积分
93

社区QQ达人

发表于 2017-1-3 17:11:59 | 显示全部楼层 |阅读模式
Chapter 1: Getting Started with Apache Spark 1
Introduction 1
Installing Spark from binaries 3
Building the Spark source code with Maven 5
Launching Spark on Amazon EC2 7
Deploying on a cluster in standalone mode 12
Deploying on a cluster with Mesos 16
Deploying on a cluster with YARN 18
Using Tachyon as an off-heap storage layer 21
Chapter 2: Developing Applications with Spark 27
Introduction 27
Exploring the Spark shell 27
Developing Spark applications in Eclipse with Maven 29
Developing Spark applications in Eclipse with SBT 33
Developing a Spark application in IntelliJ IDEA with Maven 34
Developing a Spark application in IntelliJ IDEA with SBT 36
Chapter 3: External Data Sources 39
Introduction 39
Loading data from the local filesystem 40
Loading data from HDFS 41
Loading data from HDFS using a custom InputFormat 45
Loading data from Amazon S3 47
Loading data from Apache Cassandra 49
Loading data from relational databases 54
ii
Table of Contents
Chapter 4: Spark SQL 57
Introduction 57
Understanding the Catalyst optimizer 60
Creating HiveContext 63
Inferring schema using case classes 65
Programmatically specifying the schema 66
Loading and saving data using the Parquet format 69
Loading and saving data using the JSON format 72
Loading and saving data from relational databases 74
Loading and saving data from an arbitrary source 76
Chapter 5: Spark Streaming 79
Introduction 79
Word count using Streaming 82
Streaming Twitter data 83
Streaming using Kafka 88
Chapter 6: Getting Started with Machine Learning Using MLlib 95
Introduction 95
Creating vectors 96
Creating a labeled point 98
Creating matrices 99
Calculating summary statistics 101
Calculating correlation 102
Doing hypothesis testing 104
Creating machine learning pipelines using ML 105
Chapter 7: Supervised Learning with MLlib ?Regression 109
Introduction 109
Using linear regression 111
Understanding cost function 113
Doing linear regression with lasso 118
Doing ridge regression 120
Chapter 8: Supervised Learning with MLlib ?Classification 121
Introduction 121
Doing classification using logistic regression 122
Doing binary classification using SVM 128
Doing classification using decision trees 131
Doing classification using Random Forests 138
Doing classification using Gradient Boosted Trees 143
Doing classification with Na飗e Bayes 145
iii
Table of Contents
Chapter 9: Unsupervised Learning with MLlib 147
Introduction 147
Clustering using k-means 148
Dimensionality reduction with principal component analysis 155
Dimensionality reduction with singular value decomposition 161
Chapter 10: Recommender Systems 167
Introduction 167
Collaborative filtering using explicit feedback 169
Collaborative filtering using implicit feedback 172
Chapter 11: Graph Processing Using GraphX 177
Introduction 177
Fundamental operations on graphs 178
Using PageRank 179
Finding connected components 181
Performing neighborhood aggregation 184
Chapter 12: Optimizations and Performance Tuning 187
Introduction 187
Optimizing memory 190
Using compression to improve performance 193
Using serialization to improve performance 193
Optimizing garbage collection 194
Optimizing the level of parallelism 195
Understanding the future of optimization ?project Tungsten 196
Index 199





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
相关帖子
回复

使用道具 举报

2

主题

677

广告币

727

积分

中级会员

Rank: 3Rank: 3

积分
727
发表于 2017-1-3 20:30:02 | 显示全部楼层
回复 支持 反对

使用道具 举报

6

主题

116

广告币

202

积分

初级会员

Rank: 2

积分
202

社区QQ达人

发表于 2017-1-3 20:40:05 | 显示全部楼层

文档打不开
回复 支持 反对

使用道具 举报

37

主题

692

广告币

1682

积分

高级会员

Rank: 4

积分
1682

社区QQ达人

发表于 2017-1-3 23:42:56 | 显示全部楼层
spark这种技术 aff圈会用吗
回复 支持 反对

使用道具 举报

16

主题

1101

广告币

2360

积分

高级会员

Rank: 4

积分
2360
发表于 2017-1-4 08:09:38 | 显示全部楼层
spark是什么技术?
回复 支持 反对

使用道具 举报

5

主题

14

广告币

93

积分

初级会员

Rank: 2

积分
93

社区QQ达人

 楼主| 发表于 2017-1-4 09:15:10 | 显示全部楼层
OReilly.Learning.Spark.2015.1.pdf  看这里!不知道为什么传上去打不开了 重新传了一份在这里,,

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复 支持 反对

使用道具 举报

1

主题

288

广告币

397

积分

初级会员

Rank: 2

积分
397

社区QQ达人

发表于 2018-5-5 03:44:55 | 显示全部楼层
下来看看的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-12-22 15:10 , Processed in 0.050104 second(s), 15 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表