暖石网
nuanshi

转行运营系统课 >如何处理成可分析的数据

如何处理成可分析的数据

如何处理成可分析的数据10分54秒
课程问答
薛定谔的符号
2020-07-27 10:17

阅读原文点击率为什么不是阅读原文次数/阅读原文次数呢?

而要用阅读原文人数/阅读人数呢

小暖儿 2020-07-27 14:53

同学你好,这是因为避免数据污染,剔除掉了那些同一个人重复打开文章、点击阅读原文链接的情况,以保证数据的精准。

薛定谔的符号 2020-07-27 14:54
好的,谢谢老师
小盐老师 2020-07-27 16:12

不客气~加油!

8人觉得有帮助 有帮助
何先生,公众号《摄影灯塔》,帮你零基础入门摄影。
2020-08-21 11:17
如何计算,视频后菜单栏+历史文章阅读原文数量?

视频后面那个菜单栏+历史文章阅读原文数量只占,平时发文的9%,这个是怎么算出来的呢?

我算来算去都是都是20%左右,哪有这么少啊?

请问你们是怎么算的?

半亩老师 2020-08-21 11:57

同学能否先说明一下你的计算方式呢?

何先生 2020-08-21 14:42
用4月~6月没有发文的阅读原文之和 ÷ 正常发文阅读原文之和 = 19%。(这里我没有分没有发文第二天这些)
何先生 2020-08-21 14:58
我看到很多案例,只是用没有发文的第二天且第二天不发文之和(下图) ÷ 正常发文之和 = 6.8%。那这样没有发文的当天不管了吗?
何先生 2020-08-21 15:09
我认为需要对【没有发文第一天阅读原文数】进行数据清洗,因为第一天的数据里面掺杂了昨天的数据,需要对其进行清洗才能然后再和【正常发文阅读原文数】相除,才能得出准确的不发文与发文的占比。
半亩老师 2020-08-21 19:10

同学好,看了同学的追问,发现同学实际上是对课程中讲到的数据清洗步骤没有理解。

同学首先需要知道一个前提:暖石网这个账号并不是天天发文的,大多数日子是不发文的,一个月只能发四次。

在这个基础上,同学还需要理解三个情况:

(1)有推送【文章】的那天(注意:是推送【文章】,不是【视频】,【视频】是没有阅读原文的设置的),阅读原文数的组成是【当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

(2)发了【文章】(不是【视频】)的第二天,因为依旧还有很多人来看到这篇文章,所以阅读原文数的组成是【前一天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

(3)发了【文章】之后的第三天开始,基本上就没人再看这篇文章了,所以阅读原文数的组成是【菜单栏的阅读原文数+很久之前文章中的阅读原文数】

可以看到,用情况(3)的数据除以情况(1)的数据,可以知道不受发文数据影响的阅读人数占总量的占比为多少。如果占比很低,可以忽略不计。如此计算下来就是9%。筛选放肆就是课程中的步骤和上述的内容。


【用4月~6月没有发文的阅读原文之和 ÷ 正常发文阅读原文之和 = 19%。(这里我没有分没有发文第二天这些)】同学这种统计方式,首先是没有像我说的那样,分子分母相对纯粹,另一方面,你把发【视频】日子里的数据也统计到了分母里。第三就是,我们看的是【占比】,所谓占比,就是其中一部分要除以【总量】,而不是另外一部分。你现在的逻辑是用【阅读原文数总量】其中一部分(即没有发文的阅读原文之和)除以另外一部分(即正常发文阅读原文之和 ),这个得出来的只是二者的比例,而不是占总量的占比。


【我看到很多案例,只是用没有发文的第二天且第二天不发文之和(下图) ÷ 正常发文之和 = 6.8%。那这样没有发文的当天不管了吗?】这个老师没看到图,也没理解上去同学说的案例是哪里看到的,需要同学再补充说一下。


【我认为需要对【没有发文第一天阅读原文数】进行数据清洗,因为第一天的数据里面掺杂了昨天的数据,需要对其进行清洗才能然后再和【正常发文阅读原文数】相除,才能得出准确的不发文与发文的占比。】同学可以这样做,那就是用上面说到的(3) / [(3)-(1)]即可,但还是我上一段说的,你这样计算完了的数值是【不发文与发文的比例】,不是【不发文占总量的比例】。

6人觉得有帮助 有帮助
拾七z
2020-12-27 15:53

67551132-2987-464D-B498-BED72065C0F3.jpeg老师你好!请问是用标黄色数据总和/画圈的那几个数据的总和么?我算了算去都不得劲儿,请问正确的公式应该是怎样的

小暖儿 2020-12-28 00:20

同学你好,不是这样算的,是红框数字总和/绿框数字总和。

9%是对比整体所有数据中,发文日子和没发文日子的阅读原文数数据比,就是所有未发文日子阅读原文数据之和  ➗ 所有发文日子阅读原文数据之和。目的是为了避免误差,进行的总数据汇总。

表格中只截取了部分,所以仅按照截取的部分的数据算,是没有9%的,但是课程里讲的算法是没错的。

image.png

拾七z 2020-12-29 02:14
老师!我用【所有发文后两天的人数(黄标)➗所有发文字类型文章的人数(白标)】算出等于6.9%左右,结果也小于10%,计算应该方法没错吧
小雪老师 2020-12-29 11:00

同学的公式没有错,就是黄标÷白标。由于表格截图不全,在现有展现的数字中,同学的计算没有问题。

4人觉得有帮助 有帮助
兄呆,我们都可以通过学习改变生活
2020-10-18 22:30

老师好,问题一:这个发文2天后的数据是代表着发文2天后的数据开始恢复到没发文的状态的意思吗?    问题二:这里为什么是把1和3做一个对比呢?我这边的想法是我把没发文的阅读原文点击量/没发文天数=平均每天没发文阅读原文数,然后所有的原文阅读数/总天数=每天平均的原文阅读数,这样一对比就可以得出,没发文的原文阅读数占总数的比例,如果不高就可以忽略不计,这种计算方法有问题吗?

半亩老师 2020-10-19 10:23

同学好,

【问题一:这个发文2天后的数据是代表着发文2天后的数据开始恢复到没发文的状态的意思吗?】是的,同学理解的没问题。

【 问题二:这里为什么是把1和3做一个对比呢?……】这里应该是用3和没有做过任何标记的日子做对比,也就是没受发文影响的日子和发文当天的日子做对比。同学后面说的方法也行,但是底层逻辑也还是一样的,都是用这两种情况做对比。

3人觉得有帮助 有帮助
周周与周,不找到工作不换介绍
2021-03-24 23:00

老师,【发文两天后的日子】怎么理解?

我的理解是1号发文,4号就是两天后的日子。

但视频里面的是6号了?为啥图片.png

半亩老师 2021-03-25 10:19

同学好,因为4号也发文了,我们看的是完全没有新文章发表的2天后,如果1号的2天后,也就是4号也发了文,那就是不算数的,因为4号又有因为新文章带来的阅读量了,数据还是不纯净的。

2人觉得有帮助 有帮助
微凉半夏,公众号影说人生,一个爱追剧和吐槽的姑娘
2020-09-05 16:59

老师能说下后面这三个是怎么组成的吗?还有就是能说下各自是什么意思么?

岛主老师 2020-09-05 23:03

同学你好,

【当天发文中的人数】:举个例子,公众号发了一篇文章(文章末尾设置了阅读原文的跳转链接),这个当天发文中的人数,指的就是点击这篇文章末尾的“阅读原文”的人数。

【菜单栏中的人数】:和上一个情况是类似的,这个指的是通过菜单栏中的文章点击了末尾“阅读原文”的人数。

【历史文章中的人数】:这个指的就是当天通过之前发布的文章,点击之前发布过的文章的“阅读原文”的人数。

不知道这样同学能否理解,如果还有问题欢迎继续和老师讨论~

2人觉得有帮助 有帮助
南野
2021-08-08 19:44

老师,脏数据的占比=所有未发文日子阅读原文数据之和/所有发文日子阅读原文数据之和。 

这个【所有未发文日子阅读原文数据之和】也就是标黄的部分的总和,但是这里的案例比较分明,发布也比较规律。

 

如果数据中出现在发文两天后,出现了这种情况:即发文第三天不发文或者发视频的,

那这种情况下,发文后第三天的数据是否属于【未发文日子阅读原文数据】的组成部分。

 

筱筱老师 2021-08-08 21:57

同学你好,同学理解的没有问题,第一天发文后,第二天还可能持续带些数据,但一般到发文第三天时,数据基本就很少了,所以发文后第三天的数据是属于【未发文日子阅读原文数据】的组成部分。

南野 2021-08-09 14:29
老师,不好意思,我的举例好像容易造成误解。 重新举个例子。 1、比如1号发文,两天后,指的是3号吧,所以3号的数据标黄。 我想确认的是, 假设4-5号这两天不发文,那4-5号的数据是应该标黄还是标红。 属不属于【未发文日子阅读原文数据】 按我的理解是4-5号不发文的话,那这两天带来的阅读原文数据都不受到发文影响,那应该是要标黄的。 2、如果4-5号发的是视频,也属于发文了,会影响数据,这时候需要标红。这样理解对吗?
南野 2021-08-09 18:27
实操中遇到了这样的问题。 数据日期:20200430日发文了, 0501-5号都没发文, 1号标红, 2号标黄。3-5号应该标什么颜色。我认为是标黄, 因为没有这几天应该都属于不受发文影响的,都是从菜单或者历史、其他渠道来的。不知道我的理解对不对。
琪琪老师 2021-08-09 20:28

南野同学好,

1. 发文两天后=发文后的第3天,所以如果1号发文,2天后指的是3号没错。

2. 如果1号发文,2号没发文,3号是标黄。

3. 假设4-5号都不发文时,1号发文,2-3号都没发文,那么4-5号都标黄。

4. 如果4-5号发的是视频,由于该案例是以暖石公众号为例,而暖石视频推文里没有植入阅读原文链接,相当于发视频和没发文是一样的,所以这两天带来的阅读原文数据都不受到发文影响,因此也是标黄。

琪琪老师 2021-08-09 20:31

南野同学,关于你提到的这个问题【实操中遇到了这样的问题。 数据日期:20200430日发文了, 0501-5号都没发文, 1号标红, 2号标黄。3-5号应该标什么颜色。我认为是标黄, 因为没有这几天应该都属于不受发文影响的,都是从菜单或者历史、其他渠道来的。不知道我的理解对不对。】这里你的理解是对的,这种情况下,3-5号是应该标黄,因为这3天既是发文两天后,又没有推文,所以这3天都属于不受发文影响的数据,数据都是从菜单栏或历史文章来的。

老师也理解你想表达的意思了,如下图,你想表达的是课程板书中发文、无推送、发文2天后的数据分布是规律的,因此对标黄、标红数据的判定有疑惑。还是用板书里这张图,假设里面的4.7号、4.8号都没发文,那么这2天也会被标黄。

总结规律就是:
标黄的数据,是指不受发文影响的数据,数据都是从菜单栏+历史文章来的。
标红的数据,是指未发文但受发文影响的数据,数据是从前一天发文+菜单栏+历史文章来的。

企业微信截图_9df11044-9880-4e9a-8334-cb1559401ebf.png

1人觉得有帮助 有帮助
LouisZhang,为了更好的明天,为了能够过上自己想要的生活,一件事,做了就有百分之五十可能,不做,就没有可能
2021-02-09 10:36

老师,完读率,是怎么计算来的啊

还有打开率,是不是就是,阅读文章的点击率啊

果儿 2021-02-09 12:28

同学你好:

完读率 = 完成阅读人数/阅读人数

打开率 = 图文阅读人数/图文送达人数

这些数据公众号后台都有统计,同学也可以在公众号后台相应的文职看到相关说明。

LouisZhang 2021-02-09 12:37
老师我没找到,能说具体点嘛,或者给我个图片看看
果儿 2021-02-09 12:46

进入公众号后台,左面的【菜单栏】——【统计】——【内容分析】。

image.png

image.png

image.png

1人觉得有帮助 有帮助
Hannah007,硕士转行互联网,坑多呀
2020-11-27 11:39

老师,每个计算公式都是怎么来的,有固定的公式可以参考吗,实际工作中不能自己创造公式吧

半亩老师 2020-11-27 23:26

同学好,有一些底层公式可以套用,比如百分比的计算公式,xx率其实就是百分比公式,至于到底是什么率,这个在实际工作中,还真是可以自己去创造的,或是尝试的,只要是能发现出问题,就可以。只不过,最后创造来创造去,大家采用的公式都会趋同了,因为问题就是这样的,那发现问题的公式也会是一样的。

1人觉得有帮助 有帮助
阿特
2020-08-06 15:14
为什么不对比两者的阅读原文数?

老师,那个9%是对比当天发推文和不发推文、发文2天后的阅读文章数得出来的,我们不应该对比这两者阅读原文数吗?不发推文、发文两天后的阅读原文数平均差不多55,占的比例有时候也很大,我们要算阅读原文率的话不应该误差很大吗

小盐老师 2020-08-06 17:29

同学好~
9%是对比整体所有数据中,发文日子和没发文日子的阅读原文数数据比,就是所有未发文日子阅读原文数据之和  ➗ 所有发文日子阅读原文数据之和。目的是为了避免误差,进行的总数据汇总。
【不发推文、发文两天后的阅读原文数平均差不多55,占的比例有时候也很大,我们要算阅读原文率的话不应该误差很大吗】进行所有数据汇总就是为了避免这种误差。

阿特 2020-08-06 19:27
老师,发文日子的阅读原文总人数是默认算全是当天发文带来的人数吗?当天发文应该也会有从菜单栏来的人数吧?根据小雪老师在其他回答里默认【没有发文日子、发文二天后、发视频的日子】全部为菜单栏中的人数,4月1号-4月17号里这三种类型算出来不发文平均每天通过菜单栏到官网的人数为86人,然后把表格里这三种类型数据都剔除掉,只剩下发文日子的阅读原文人数数据,阅读原文人数=当天发文人数+菜单栏的人数+历史文章中的人数,按每天86人是从菜单栏来,9天当天发文中菜单栏来的总人数 除 9天当天发文阅读总人数,占比的话会达到25%呢
小盐老师 2020-08-06 23:01

一般来说发文后的第二天对数据基本上就没有什么影响了,我们把这个数据看作从菜单栏来的人数。
小雪老师的那个回答是【数据清洗】就是把是发视频的日子和之后第一天的数据删除掉,因为这些日子仍然是受影响的,我们可以看到发视频的日子和发文后一天的数据和发文两天后数据还是有差距的,在这一点上小雪老师的表述不够清楚,有一定歧义,我会联系小雪老师进行改正。也就是说,我们的从菜单栏来的用户不能加上视频日和发布后一天的数据。
数据分析比较繁琐,不知道我讲的是否让同学弄明白了,还有不清楚的我们可以继续讨论~

阿特 2020-08-07 16:12
老师,我又看了几遍视频后大致上弄懂了,但有一个细节问题,老师在视频里讲,就是说发文1天后、发视频的日子的阅读原文人数多多少少是会分别受到当天发文一天后的阅读人数影响 和 推送视频给用户为公众号带来的流量影响,导致阅读原文人数(菜单栏+历史文章)不是很准确,然后说明发文2天后的阅读原文人数(菜单栏+历史文章)是比较准确,老师其实可以直接在视频里说明不看标红的阅读原文人数数据,对比标黄的数据和白色当天发文数据就可以了呀,为何中途老师说要对比一下1.没有推文的日子和3.发文后两天的日子呢?1的话本身阅读原文人数(菜单栏+历史文章)就有点误差,3相对而言阅读原文人数(菜单栏+历史阅读)会比较准确,对比的意义何在呢?如果两者相差较大又说明什么呢?我们的目的不是对比发文数据和没发文数据吗?直接直入主题对比标黄的和白色的数据就可以了呀
琪琪老师 2020-08-07 22:11

同学好,对比标黄和标白的数据,是要确认发文2天后的数据基本准确,不会对整体数据造成太大误差。1的话就像同学提到的,由于它本身会存在误差,所以要看一下占比是多少,来看误差的大小。如果相差较大,则需要引起重视,通过数据分析背后对应的原因,在后期调整优化。又由于该案例的前提是,视频推文未植入阅读原文链接,也就是说2的情况等于1——没有推送文章的日子,因为没有推送文章的日子自然也不会有植入阅读原文链接的情况,所以是对比1和3。

阿特 2020-08-07 22:26

老师可以回答具体一点吗🤣重视之后然后呢

琪琪老师 2020-08-07 22:40

如果相差较大,一方面需要在筛选最终需要的表格数据时,剔除存在误差的数据,也就是做数据清理,确保不影响分析结果。另一方面需要分析背后对应的原因,在后期调整优化。

1人觉得有帮助 有帮助
程程程程何
2020-08-02 12:14
这个公式是怎么来的?

360截图20200802083423721.jpg老师,问一下,这个公式是怎么来的?

英英老师 2020-08-02 20:18

这个就是某一天内,所有能够产生阅读原文的地方的数据的加和。

1人觉得有帮助 有帮助
斗南一人二
2020-07-26 20:52

老师请问,在没发文和发视频的日子标红,发文2天后的日子标黄这里,为什么主要对比1和3呢?

小雪老师 2020-07-26 21:08

同学你好,

我们这一步的目的是【清洗数据,防止干扰】。

我们可以默认为在没有发文以及发视频的日子里,阅读原文的点击并不是来自于文章,而是来自于自定义菜单,那么我们要确定这一部分的数据占比是不是很大,如果很大,那就对我们分析文章数据会有干扰(因为前面我们说了,默认这些不是文章里的数据,而是菜单里的)。


发文2天后的日子也是一样,上一个问题的回答也说到了,通常情况是发文2天后文章基本没有什么阅读了,所以这个时候我们也默认这些阅读原文的点击都是来自自定义菜单。


将前面两个默认的前提进行对比,发现【没法文的日子】和【发文2天后日子】的数据基本一致,且对比发文日子数据,占比很小(只有9%),可以忽略不计,于是本次【清晰数据,防止干扰】的结果就是,这些数据几乎不会对我们分析文章造成干扰。

斗南一人二 2020-07-26 22:54
还是没太明白,为什么不是1和2或者2和3呢?
小暖儿 2020-07-27 10:39

该案例的一个前提是,视频推文未植入阅读原文链接,也就是说2的情况等于1——没有推送文章的日子,因为没有推送文章的日子自然也不会有植入阅读原文链接的情况,所以对比1和3即可。

斗南一人二 2020-07-27 15:42
这个我明白了感谢老师! 老师我还有一个疑问,我发现课程中【发视频的日子】它的阅读人数比【没发文的日子】和【发文两天后的日子】多得多,这是什么原因呢?是因为视频的播放次数,也被算作了阅读人数吗?
小盐老师 2020-07-27 17:34

同学好~

你可以简单粗暴的把发视频和发文章理解为一类,就是我今天发布内容了,那么发布内容的当天数据肯定时要比之后两天要高的。【这是什么原因呢?】很简单,我们在读公众号文章的时候,因为当天是有推送的,所以我们都是读当天的,我们很少会去向前翻很久去浏览一篇之前的文章。这是大家的浏览习惯造成的,但是即便今天仅仅发布的是视频,没有阅读原文按钮,但是还会有一部分看了视频的人去点击其他部分,这就导致了发视频当天数据也会有一个增长。

1人觉得有帮助 有帮助
Jo462
2022-10-02 15:53

谷歌分析的课程在哪里可以看到?

英英老师 2022-10-02 23:47

https://www.nuanshi100.com/credits/w34.html这个是暖石的课程, https://support.google.com/analytics/?hl=zh-Hans#topic=10737980这个是谷歌的帮助中心,两个可以结合看。

0人觉得有帮助 有帮助
若卿y,想要转行运营的打工人
2022-07-09 15:11

1.阅读原文点击率=阅读原文点击人数/文章的完读人数
2.完读率=文章的完读人数/文章的阅读人数(点击文章人数)
3.点击率=文章的阅读人数/推文送达人数

老师,可以这么算吗?还是说除以次数?

我看到提问区和课程视频里的公式不太一样,所以有点懵。

英英老师 2022-07-10 21:32

可以这样算,最后结果是接近一样的。

0人觉得有帮助 有帮助
usit
2022-07-03 12:12

刷选没有发文日子是自己重新找吗

英英老师 2022-07-03 22:11

你自己工作中哪天没发文,自己是知道的啊。对于作业来说,直接看哪天没发即可。

usit 2022-07-04 07:30
那对于这个作业给出的4—6月的单篇数据,里面的是都发文的呗,就不用筛选了吧, 要是筛选的话,是自己从新列表格填吗
沐沐老师 2022-07-04 11:40

是的,表格中出现的数据都是当天已经发文的,但里面除了图文内容外还有发布的视频等数据,要按照作业要求计算数据的话还是需要在表格中筛选处理的。

【 要是筛选的话,是自己从新列表格填吗】如果同学有这个需求,直接复制原有表格到自己的表格中进行后续处理即可。

0人觉得有帮助 有帮助
戴木木
2022-05-16 11:47

(当天发文的阅读原文数)是指新发布文章的阅读原文数量么?是指哪个入口呢?还是只要看了新文章原文的都算进去?

菜单栏阅读原文数是指哪个入口数量呢?这个不是很清楚。

 

筱筱老师 2022-05-16 18:09

同学你好,

【(当天发文的阅读原文数)是指新发布文章的阅读原文数量么?是指哪个入口呢?还是只要看了新文章原文的都算进去?】这个当天发文中的阅读原文数,指的就是点击这篇文章末尾的“阅读原文”的人数。

【菜单栏阅读原文数是指哪个入口数量呢?这个不是很清楚。】指的是通过菜单栏中的文章点击了末尾“阅读原文”的人数。

0人觉得有帮助 有帮助
嘉月
2022-05-14 13:34

老师你好,不是很明白为什么数据清洗需要把历史阅读原文人数的数据也清洗掉。历史阅读原文人数本身也包含在通过推文点击阅读原文的人数中,为什么不直接看菜单分析的人数占当天总阅读原文人数的占比,然后把菜单分析的阅读原文人数清除掉?

英英老师 2022-05-15 11:16

因为用户来源不同,导致质量不同,关注点不同,行为也会完全不同。某类用户占阅读总数的10%,不一定意味着他们就一定占点击原文总数的10%。

0人觉得有帮助 有帮助
树与江
2022-03-18 14:40

我有一个疑问:

按照课程里提到的,【所有未发文日子(主要指发文2天后)阅读原文数据之和  ➗ 所有发文日子(包括发文2天及以内)阅读原文数据之和】,这个比率用来计算菜单栏及历史文章阅读原文数在整体阅读原文数中的分量,继而来判断是否有必要进行数据清洗。

可是,所有发文日子(包括发文2天及以内)所产生的阅读原文数,本身就有一部分是来自于菜单栏及历史文章的,这部分数据自己就并“不干净”,所以这个算法真的准确吗?

英英老师 2022-03-18 21:30

课程此处说得有些理想,我们正在制作新版的数据分析课程。

在这里,你可以这样理解,只要是发文一天之后的数据,都可以近似地作为可用数据来分析转发率打开率等,在99%的公司场景下,是不需要做数据清洗的。

0人觉得有帮助 有帮助
爱吃年糕
2022-03-12 10:10

老师好,如果按视频里说的,验证下来可以将当天有发文的阅读原文数全部视作发文带来的数据,那发文后第2天的数据怎么来对待呢?第2天还是有前一天发文带来的数据的,但是相对来说占比又没有那么大了。麻烦老师解答,谢谢。

英英老师 2022-03-12 17:57

实际工作中,第二天的数据可以忽略掉,就不统计了。或者每周统计一次这个内容的周总阅读转发等数据。

爱吃年糕 2022-03-12 19:08
哦,还有个问题就是,如果“脏数据”占比比较大的话该怎么处理呢?是只能借用第三方工具检测了么?如果公司没有用第三方工具该怎么办呢?
英英老师 2022-03-12 23:06

实际工作中,那这次就干脆不要分析了。新媒体的数据分析本来就只能近似准确,不可能完全科学,所以真的脏到这份儿上就只能算了。

爱吃年糕 2022-03-13 10:08
什么叫不要分析了呀 ?不好意思没太明白,那也不能说这个月或这个周的数据全都放弃掉了呀?
英英老师 2022-03-13 10:35

不是这个月的就放弃,而是这条内容就不分析或者简单分析了,然后先去解决一下数据污染的问题。

爱吃年糕 2022-03-13 11:26
按照视频里的讲解,看脏数据是否占比较多,是用一个周期内 黄色的部分总和/白色的部分总和 对吧?我的意思是,如果得出的脏数据占比较大,就不能忽略掉,就不能认为当天的阅读原文数全部来自发文的阅读原文数了,那具体该怎么分析呢?不知道我描述清楚了吗?
英英老师 2022-03-14 02:56

你描述清楚了,如果脏数据太多,实际上就应该放弃分析,去做一些脏数据少的内容,然后再分析,在脏数据上耗费太多时间已经没有意义。

0人觉得有帮助 有帮助
想转运营,一只想看雪的蚂蚱
2022-03-07 11:06

老师,你好

数据清洗是否每次发文都要去做?

琳西老师 2022-03-07 11:39

同学好,工作中我们一般不会经常去做数据分析,可能1个月、也可能几个月一次,每次要分析数据时清洗即可,不需要每次发文都去做。

想转运营 2022-03-07 18:39
在一个月中,不断的去发文,公众号的用户增量肯定会比上一次的增多,那如何确保【历史文章阅读原文+菜单栏文章的阅读原文】就不会增加呢?还是随着用户体量的不断增加,当天发文,历史文章,菜单栏文章都在增加,占比还是不变?
琳西老师 2022-03-07 22:09

我们这一步是处理脏数据,不需要考虑数据是否增加,看的是这一个月数据的总和占比是高还是低,不需要看变化。


如果我们分析一个月之后 还需要分析两个月,才需要考虑同学说的问题,一般如果不做运营动作上的调整,不管是一个月还是两个月 占比肯定是相近的。同学的理解是正确的。

0人觉得有帮助 有帮助
Barry943
2022-02-28 15:37

老师,这里不懂,是用总的阅读数减去标红和标黄就可以大概估算出实际通过推文阅读原文的数据吗

沐沐老师 2022-02-28 20:58

同学好,【是用总的阅读数减去标红和标黄就可以大概估算出实际通过推文阅读原文的数据吗】不是的哈,小伙伴可以看看下面的步骤:

1)有推送【文章】的那天(未标注颜色),阅读原文数的组成是【当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

2)发了【文章】(未标注颜色)的第二天,因为依旧还有很多人来看到这篇文章,所以阅读原文数的组成是【前一天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

3)发了【文章】之后的第三天开始(标黄色),基本上就没人再看这篇文章了,所以阅读原文数的组成是【菜单栏的阅读原文数+很久之前文章中的阅读原文数】

4)没有发文(标注红色),以及发布视频(标注红色)无阅读原文数据

可以看到,先剔除4)的数据,也就是直接忽略,然后用3)的数据除以1)的数据,可以知道不受发文数据影响的阅读人数占总量的占比为多少。如果占比很低,可以忽略不计。如此计算下来就是9%。

0人觉得有帮助 有帮助
范范28
2022-01-11 23:37

老师,我不是很能理解清洗数据中,标黄数据/标白数据,比例低于9%以后,就可以默认为:【当天的原文阅读量,都是当天推文带来】的逻辑

我的理解:

标黄数据=【菜单栏】+【2天前的历史推文】

标白数据=【当天推文】+【前1天推文】+【前2天推文】+【菜单栏】+【2天前的历史推文】

标黄数据/标白数据的占比低,应该可以推导出:每天的原文阅读量对【当天推文】+【前1天推文】+【前2天推文】的影响较大,无法排出前2天的推文带来的影响

 因此,视频+不发文的日子,阅读原文点击率也很高,因为是【前1天推文】+【前2天推文】带来的影响

所以按照课程给的逻辑,我无法理解阅读原文的点击率都是由【当天推文】带来的我认为无法排出前2天的推文带来的影响

思思老师 2022-01-12 11:08

同学你好,

同学首先需要知道一个前提:暖石网这个账号并不是天天发文的,大多数日子是不发文的。

在这个基础上,同学还需要理解三个情况:

(1)有推送【文章】的那天(注意:是推送【文章】,不是【视频】,【视频】是没有阅读原文的设置的),阅读原文数的组成是【当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

(2)发了【文章】(不是【视频】)的第二天,因为依旧还有很多人来看到这篇文章,所以阅读原文数的组成是【前一天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

(3)发了【文章】之后的第三天开始,从以往的数据观察,基本上就没什么人再看这篇文章了,所以阅读原文数的组成是【菜单栏的阅读原文数+很久之前文章中的阅读原文数】

9%是对比整体所有数据中,发文日子和没发文日子的阅读原文数数据比,就是所有未发文日子阅读原文数据之和  ➗ 所有发文日子阅读原文数据之和。目的是为了避免误差,进行的总数据汇总。

表格中只截取了部分,所以仅按照截取的部分的数据算,是没有9%的,筛选方式就是课程中的步骤和上述的内容。

范范28 2022-01-12 13:52
1、【同学首先需要知道一个前提:暖石网这个账号并不是天天发文的,大多数日子是不发文的。】 数据表格给的数据很多都是日期连在一起的,如果数据都间隔比较远,我也不会有此次的疑问了 2、【有推送【文章】的那天(注意:是推送【文章】,不是【视频】,【视频】是没有阅读原文的设置的),阅读原文数的组成是【当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】 同样:基于原始数据表格中,很多文章都是每天连续发的,所以,当天发文 无法剔除前2天文章带来的影响,所以我无法认同:有推送【文章】阅读原文数=当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】 3、总的来说,可能老师给的前提【大多数日子不发文】是和给的表格数据是冲突的,所以产生了疑问
思思老师 2022-01-12 15:20

同学好,

1、我们首先看一下:【标黄】和【标白】相比,到底是为了什么

课程中我们说到的公式是阅读原文人数=当天发文带来的人数+【菜单栏带来的人数+历史文章的人数】

标黄的数据:是发文两天后的数据,但是有一个前提是这个数据前两天是没有文章推送的,即你截图的4月6号的数据,可以看到4月5号没有发文、4月4号发的是视频,不是文章,视频没有阅读原文,所以4月6号这个数据是纯粹的,没有被污染的;

标红的数据:是没有推送日子和发视频的日子

标白色的数据:是发文的日子

那么标黄和表白比:是为了看【菜单栏带来的人数+历史文章的人数】这部分数据,占整体的比重有多大

2、其次,咱们在选取样本量的时候,要保证索取的样本的纯粹。

像你框柱的4月4号的数据,虽然是1号发文后两天。但是,2号和3号还有发文,这个4月4号的数据是被前两天污染的,它不能作为样本量去做计算。同理,4月14号、4月16号的数据,也是被污染的数据。如果用被污染的数据作为样本数据去计算,那结论是不准确的。

范范28 2022-01-12 16:09
老师,你的回答不是我的疑问 1、我理解标黄和标白数据的含义,也理解【标黄和标白比:是为了看【菜单栏带来的人数+历史文章的人数】这部分数据,占整体的比重有多大】 2、我不能理解的是,标黄和标白经过对比,可以的出,标白的数据:就是发文当天的文章带来的数据 3、就像我前面提到的,原始表格数据中给出的很多文章都是连续发送的,所以不能排除前两天推文带来的影响 而老师第一次回答中,对于这个疑问给的前提是【公众号文章不是天天发的】,我认为这2者有冲突
思思老师 2022-01-12 17:45

刚刚微信联系了同学,同学接下来还有什么问题欢迎和老师沟通~

0人觉得有帮助 有帮助
一定会成功转行的567,《转行:发现一个未知的自己》读书会持续招募ing...
2022-01-06 16:07

我有个疑问,直接问了啊。算出来脏数据(也就是并非该篇文章带来的阅读原文数)9%,然后这个数据会怎么被使用?

半亩老师 2022-01-06 17:44

同学好,这个9%算出来就是为了看一下它占比高不高,没超过10%就算不高,脏数据可以忽略不计。后面这个9%就没用了。

0人觉得有帮助 有帮助
陈言
2021-12-03 15:45

老师请问这个是老师回答其他同学的答案,发现老师红框里圈的是发文后第三天的数据,但是我统计的这10篇文章,是没有出现第三天没发文的情况 ,应该要怎么算了呢?

没发文的日子阅读原文数总和/发文的日子阅读原文数总和  那这里发文的日子要算上发视频的日子吗?

果儿 2021-12-03 22:30

问题1刚才回答过了,不说了。

问题2:【没发文的日子阅读原文数总和/发文的日子阅读原文数总和  那这里发文的日子要算上发视频的日子吗?】——这里是不算发视频的日子的,因为视频没有「阅读原文」,所以在计算原文跳转率的时候就不算发视频的日子。

0人觉得有帮助 有帮助
陈言
2021-12-03 15:40

老师请问这个是老师回答其他同学的答案,发现老师红框里圈的是发文后第三天的数据,但是我统计的这10篇文章,是没有出现第三天没发文的情况 ,应该要怎么算了呢

果儿 2021-12-03 22:22

同学,你这个5月24号、5月31号、6月7号,不都是发文后的第3天么?

我们之所以要卡发文后的第三天,是因为通常来讲,一个文章发完后的2天之内都还是有人从文章直接点进来看的,但是两天之后的自然流量就几乎很少了,大部分是从历史文章菜单栏里来的了。所以咱们有第三天的就统计出来,没有第三天的我们就不考虑这个清洗维度了。不知道老师有解释清楚没有。

0人觉得有帮助 有帮助

如何处理成可分析的数据

< 返回课程表
展开全部
课程问答
2020-07-27 10:17

阅读原文点击率为什么不是阅读原文次数/阅读原文次数呢?

而要用阅读原文人数/阅读人数呢

小暖儿 2020-07-27 14:53

同学你好,这是因为避免数据污染,剔除掉了那些同一个人重复打开文章、点击阅读原文链接的情况,以保证数据的精准。

薛定谔的符号 2020-07-27 14:54
好的,谢谢老师
小盐老师 2020-07-27 16:12

不客气~加油!

8人觉得有帮助 有帮助
2020-08-21 11:17
如何计算,视频后菜单栏+历史文章阅读原文数量?
半亩老师 2020-08-21 11:57

同学能否先说明一下你的计算方式呢?

何先生 2020-08-21 14:42
用4月~6月没有发文的阅读原文之和 ÷ 正常发文阅读原文之和 = 19%。(这里我没有分没有发文第二天这些)
何先生 2020-08-21 14:58
我看到很多案例,只是用没有发文的第二天且第二天不发文之和(下图) ÷ 正常发文之和 = 6.8%。那这样没有发文的当天不管了吗?
何先生 2020-08-21 15:09
我认为需要对【没有发文第一天阅读原文数】进行数据清洗,因为第一天的数据里面掺杂了昨天的数据,需要对其进行清洗才能然后再和【正常发文阅读原文数】相除,才能得出准确的不发文与发文的占比。
半亩老师 2020-08-21 19:10

同学好,看了同学的追问,发现同学实际上是对课程中讲到的数据清洗步骤没有理解。

同学首先需要知道一个前提:暖石网这个账号并不是天天发文的,大多数日子是不发文的,一个月只能发四次。

在这个基础上,同学还需要理解三个情况:

(1)有推送【文章】的那天(注意:是推送【文章】,不是【视频】,【视频】是没有阅读原文的设置的),阅读原文数的组成是【当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

(2)发了【文章】(不是【视频】)的第二天,因为依旧还有很多人来看到这篇文章,所以阅读原文数的组成是【前一天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

(3)发了【文章】之后的第三天开始,基本上就没人再看这篇文章了,所以阅读原文数的组成是【菜单栏的阅读原文数+很久之前文章中的阅读原文数】

可以看到,用情况(3)的数据除以情况(1)的数据,可以知道不受发文数据影响的阅读人数占总量的占比为多少。如果占比很低,可以忽略不计。如此计算下来就是9%。筛选放肆就是课程中的步骤和上述的内容。


【用4月~6月没有发文的阅读原文之和 ÷ 正常发文阅读原文之和 = 19%。(这里我没有分没有发文第二天这些)】同学这种统计方式,首先是没有像我说的那样,分子分母相对纯粹,另一方面,你把发【视频】日子里的数据也统计到了分母里。第三就是,我们看的是【占比】,所谓占比,就是其中一部分要除以【总量】,而不是另外一部分。你现在的逻辑是用【阅读原文数总量】其中一部分(即没有发文的阅读原文之和)除以另外一部分(即正常发文阅读原文之和 ),这个得出来的只是二者的比例,而不是占总量的占比。


【我看到很多案例,只是用没有发文的第二天且第二天不发文之和(下图) ÷ 正常发文之和 = 6.8%。那这样没有发文的当天不管了吗?】这个老师没看到图,也没理解上去同学说的案例是哪里看到的,需要同学再补充说一下。


【我认为需要对【没有发文第一天阅读原文数】进行数据清洗,因为第一天的数据里面掺杂了昨天的数据,需要对其进行清洗才能然后再和【正常发文阅读原文数】相除,才能得出准确的不发文与发文的占比。】同学可以这样做,那就是用上面说到的(3) / [(3)-(1)]即可,但还是我上一段说的,你这样计算完了的数值是【不发文与发文的比例】,不是【不发文占总量的比例】。

6人觉得有帮助 有帮助
2020-12-27 15:53

67551132-2987-464D-B498-BED72065C0F3.jpeg老师你好!请问是用标黄色数据总和/画圈的那几个数据的总和么?我算了算去都不得劲儿,请问正确的公式应该是怎样的

小暖儿 2020-12-28 00:20

同学你好,不是这样算的,是红框数字总和/绿框数字总和。

9%是对比整体所有数据中,发文日子和没发文日子的阅读原文数数据比,就是所有未发文日子阅读原文数据之和  ➗ 所有发文日子阅读原文数据之和。目的是为了避免误差,进行的总数据汇总。

表格中只截取了部分,所以仅按照截取的部分的数据算,是没有9%的,但是课程里讲的算法是没错的。

image.png

拾七z 2020-12-29 02:14
老师!我用【所有发文后两天的人数(黄标)➗所有发文字类型文章的人数(白标)】算出等于6.9%左右,结果也小于10%,计算应该方法没错吧
小雪老师 2020-12-29 11:00

同学的公式没有错,就是黄标÷白标。由于表格截图不全,在现有展现的数字中,同学的计算没有问题。

4人觉得有帮助 有帮助
2020-10-18 22:30

老师好,问题一:这个发文2天后的数据是代表着发文2天后的数据开始恢复到没发文的状态的意思吗?    问题二:这里为什么是把1和3做一个对比呢?我这边的想法是我把没发文的阅读原文点击量/没发文天数=平均每天没发文阅读原文数,然后所有的原文阅读数/总天数=每天平均的原文阅读数,这样一对比就可以得出,没发文的原文阅读数占总数的比例,如果不高就可以忽略不计,这种计算方法有问题吗?

半亩老师 2020-10-19 10:23

同学好,

【问题一:这个发文2天后的数据是代表着发文2天后的数据开始恢复到没发文的状态的意思吗?】是的,同学理解的没问题。

【 问题二:这里为什么是把1和3做一个对比呢?……】这里应该是用3和没有做过任何标记的日子做对比,也就是没受发文影响的日子和发文当天的日子做对比。同学后面说的方法也行,但是底层逻辑也还是一样的,都是用这两种情况做对比。

3人觉得有帮助 有帮助
2021-03-24 23:00

老师,【发文两天后的日子】怎么理解?

我的理解是1号发文,4号就是两天后的日子。

但视频里面的是6号了?为啥图片.png

半亩老师 2021-03-25 10:19

同学好,因为4号也发文了,我们看的是完全没有新文章发表的2天后,如果1号的2天后,也就是4号也发了文,那就是不算数的,因为4号又有因为新文章带来的阅读量了,数据还是不纯净的。

2人觉得有帮助 有帮助
2020-09-05 16:59

老师能说下后面这三个是怎么组成的吗?还有就是能说下各自是什么意思么?

岛主老师 2020-09-05 23:03

同学你好,

【当天发文中的人数】:举个例子,公众号发了一篇文章(文章末尾设置了阅读原文的跳转链接),这个当天发文中的人数,指的就是点击这篇文章末尾的“阅读原文”的人数。

【菜单栏中的人数】:和上一个情况是类似的,这个指的是通过菜单栏中的文章点击了末尾“阅读原文”的人数。

【历史文章中的人数】:这个指的就是当天通过之前发布的文章,点击之前发布过的文章的“阅读原文”的人数。

不知道这样同学能否理解,如果还有问题欢迎继续和老师讨论~

2人觉得有帮助 有帮助
2021-08-08 19:44

老师,脏数据的占比=所有未发文日子阅读原文数据之和/所有发文日子阅读原文数据之和。 

这个【所有未发文日子阅读原文数据之和】也就是标黄的部分的总和,但是这里的案例比较分明,发布也比较规律。

 

如果数据中出现在发文两天后,出现了这种情况:即发文第三天不发文或者发视频的,

那这种情况下,发文后第三天的数据是否属于【未发文日子阅读原文数据】的组成部分。

 

筱筱老师 2021-08-08 21:57

同学你好,同学理解的没有问题,第一天发文后,第二天还可能持续带些数据,但一般到发文第三天时,数据基本就很少了,所以发文后第三天的数据是属于【未发文日子阅读原文数据】的组成部分。

南野 2021-08-09 14:29
老师,不好意思,我的举例好像容易造成误解。 重新举个例子。 1、比如1号发文,两天后,指的是3号吧,所以3号的数据标黄。 我想确认的是, 假设4-5号这两天不发文,那4-5号的数据是应该标黄还是标红。 属不属于【未发文日子阅读原文数据】 按我的理解是4-5号不发文的话,那这两天带来的阅读原文数据都不受到发文影响,那应该是要标黄的。 2、如果4-5号发的是视频,也属于发文了,会影响数据,这时候需要标红。这样理解对吗?
南野 2021-08-09 18:27
实操中遇到了这样的问题。 数据日期:20200430日发文了, 0501-5号都没发文, 1号标红, 2号标黄。3-5号应该标什么颜色。我认为是标黄, 因为没有这几天应该都属于不受发文影响的,都是从菜单或者历史、其他渠道来的。不知道我的理解对不对。
琪琪老师 2021-08-09 20:28

南野同学好,

1. 发文两天后=发文后的第3天,所以如果1号发文,2天后指的是3号没错。

2. 如果1号发文,2号没发文,3号是标黄。

3. 假设4-5号都不发文时,1号发文,2-3号都没发文,那么4-5号都标黄。

4. 如果4-5号发的是视频,由于该案例是以暖石公众号为例,而暖石视频推文里没有植入阅读原文链接,相当于发视频和没发文是一样的,所以这两天带来的阅读原文数据都不受到发文影响,因此也是标黄。

琪琪老师 2021-08-09 20:31

南野同学,关于你提到的这个问题【实操中遇到了这样的问题。 数据日期:20200430日发文了, 0501-5号都没发文, 1号标红, 2号标黄。3-5号应该标什么颜色。我认为是标黄, 因为没有这几天应该都属于不受发文影响的,都是从菜单或者历史、其他渠道来的。不知道我的理解对不对。】这里你的理解是对的,这种情况下,3-5号是应该标黄,因为这3天既是发文两天后,又没有推文,所以这3天都属于不受发文影响的数据,数据都是从菜单栏或历史文章来的。

老师也理解你想表达的意思了,如下图,你想表达的是课程板书中发文、无推送、发文2天后的数据分布是规律的,因此对标黄、标红数据的判定有疑惑。还是用板书里这张图,假设里面的4.7号、4.8号都没发文,那么这2天也会被标黄。

总结规律就是:
标黄的数据,是指不受发文影响的数据,数据都是从菜单栏+历史文章来的。
标红的数据,是指未发文但受发文影响的数据,数据是从前一天发文+菜单栏+历史文章来的。

企业微信截图_9df11044-9880-4e9a-8334-cb1559401ebf.png

1人觉得有帮助 有帮助
2021-02-09 10:36

老师,完读率,是怎么计算来的啊

还有打开率,是不是就是,阅读文章的点击率啊

果儿 2021-02-09 12:28

同学你好:

完读率 = 完成阅读人数/阅读人数

打开率 = 图文阅读人数/图文送达人数

这些数据公众号后台都有统计,同学也可以在公众号后台相应的文职看到相关说明。

LouisZhang 2021-02-09 12:37
老师我没找到,能说具体点嘛,或者给我个图片看看
果儿 2021-02-09 12:46

进入公众号后台,左面的【菜单栏】——【统计】——【内容分析】。

image.png

image.png

image.png

1人觉得有帮助 有帮助
2020-11-27 11:39

老师,每个计算公式都是怎么来的,有固定的公式可以参考吗,实际工作中不能自己创造公式吧

半亩老师 2020-11-27 23:26

同学好,有一些底层公式可以套用,比如百分比的计算公式,xx率其实就是百分比公式,至于到底是什么率,这个在实际工作中,还真是可以自己去创造的,或是尝试的,只要是能发现出问题,就可以。只不过,最后创造来创造去,大家采用的公式都会趋同了,因为问题就是这样的,那发现问题的公式也会是一样的。

1人觉得有帮助 有帮助
2020-08-06 15:14
为什么不对比两者的阅读原文数?
小盐老师 2020-08-06 17:29

同学好~
9%是对比整体所有数据中,发文日子和没发文日子的阅读原文数数据比,就是所有未发文日子阅读原文数据之和  ➗ 所有发文日子阅读原文数据之和。目的是为了避免误差,进行的总数据汇总。
【不发推文、发文两天后的阅读原文数平均差不多55,占的比例有时候也很大,我们要算阅读原文率的话不应该误差很大吗】进行所有数据汇总就是为了避免这种误差。

阿特 2020-08-06 19:27
老师,发文日子的阅读原文总人数是默认算全是当天发文带来的人数吗?当天发文应该也会有从菜单栏来的人数吧?根据小雪老师在其他回答里默认【没有发文日子、发文二天后、发视频的日子】全部为菜单栏中的人数,4月1号-4月17号里这三种类型算出来不发文平均每天通过菜单栏到官网的人数为86人,然后把表格里这三种类型数据都剔除掉,只剩下发文日子的阅读原文人数数据,阅读原文人数=当天发文人数+菜单栏的人数+历史文章中的人数,按每天86人是从菜单栏来,9天当天发文中菜单栏来的总人数 除 9天当天发文阅读总人数,占比的话会达到25%呢
小盐老师 2020-08-06 23:01

一般来说发文后的第二天对数据基本上就没有什么影响了,我们把这个数据看作从菜单栏来的人数。
小雪老师的那个回答是【数据清洗】就是把是发视频的日子和之后第一天的数据删除掉,因为这些日子仍然是受影响的,我们可以看到发视频的日子和发文后一天的数据和发文两天后数据还是有差距的,在这一点上小雪老师的表述不够清楚,有一定歧义,我会联系小雪老师进行改正。也就是说,我们的从菜单栏来的用户不能加上视频日和发布后一天的数据。
数据分析比较繁琐,不知道我讲的是否让同学弄明白了,还有不清楚的我们可以继续讨论~

阿特 2020-08-07 16:12
老师,我又看了几遍视频后大致上弄懂了,但有一个细节问题,老师在视频里讲,就是说发文1天后、发视频的日子的阅读原文人数多多少少是会分别受到当天发文一天后的阅读人数影响 和 推送视频给用户为公众号带来的流量影响,导致阅读原文人数(菜单栏+历史文章)不是很准确,然后说明发文2天后的阅读原文人数(菜单栏+历史文章)是比较准确,老师其实可以直接在视频里说明不看标红的阅读原文人数数据,对比标黄的数据和白色当天发文数据就可以了呀,为何中途老师说要对比一下1.没有推文的日子和3.发文后两天的日子呢?1的话本身阅读原文人数(菜单栏+历史文章)就有点误差,3相对而言阅读原文人数(菜单栏+历史阅读)会比较准确,对比的意义何在呢?如果两者相差较大又说明什么呢?我们的目的不是对比发文数据和没发文数据吗?直接直入主题对比标黄的和白色的数据就可以了呀
琪琪老师 2020-08-07 22:11

同学好,对比标黄和标白的数据,是要确认发文2天后的数据基本准确,不会对整体数据造成太大误差。1的话就像同学提到的,由于它本身会存在误差,所以要看一下占比是多少,来看误差的大小。如果相差较大,则需要引起重视,通过数据分析背后对应的原因,在后期调整优化。又由于该案例的前提是,视频推文未植入阅读原文链接,也就是说2的情况等于1——没有推送文章的日子,因为没有推送文章的日子自然也不会有植入阅读原文链接的情况,所以是对比1和3。

阿特 2020-08-07 22:26

老师可以回答具体一点吗🤣重视之后然后呢

琪琪老师 2020-08-07 22:40

如果相差较大,一方面需要在筛选最终需要的表格数据时,剔除存在误差的数据,也就是做数据清理,确保不影响分析结果。另一方面需要分析背后对应的原因,在后期调整优化。

1人觉得有帮助 有帮助
2020-08-02 12:14
这个公式是怎么来的?
英英老师 2020-08-02 20:18

这个就是某一天内,所有能够产生阅读原文的地方的数据的加和。

1人觉得有帮助 有帮助
2020-07-26 20:52

老师请问,在没发文和发视频的日子标红,发文2天后的日子标黄这里,为什么主要对比1和3呢?

小雪老师 2020-07-26 21:08

同学你好,

我们这一步的目的是【清洗数据,防止干扰】。

我们可以默认为在没有发文以及发视频的日子里,阅读原文的点击并不是来自于文章,而是来自于自定义菜单,那么我们要确定这一部分的数据占比是不是很大,如果很大,那就对我们分析文章数据会有干扰(因为前面我们说了,默认这些不是文章里的数据,而是菜单里的)。


发文2天后的日子也是一样,上一个问题的回答也说到了,通常情况是发文2天后文章基本没有什么阅读了,所以这个时候我们也默认这些阅读原文的点击都是来自自定义菜单。


将前面两个默认的前提进行对比,发现【没法文的日子】和【发文2天后日子】的数据基本一致,且对比发文日子数据,占比很小(只有9%),可以忽略不计,于是本次【清晰数据,防止干扰】的结果就是,这些数据几乎不会对我们分析文章造成干扰。

斗南一人二 2020-07-26 22:54
还是没太明白,为什么不是1和2或者2和3呢?
小暖儿 2020-07-27 10:39

该案例的一个前提是,视频推文未植入阅读原文链接,也就是说2的情况等于1——没有推送文章的日子,因为没有推送文章的日子自然也不会有植入阅读原文链接的情况,所以对比1和3即可。

斗南一人二 2020-07-27 15:42
这个我明白了感谢老师! 老师我还有一个疑问,我发现课程中【发视频的日子】它的阅读人数比【没发文的日子】和【发文两天后的日子】多得多,这是什么原因呢?是因为视频的播放次数,也被算作了阅读人数吗?
小盐老师 2020-07-27 17:34

同学好~

你可以简单粗暴的把发视频和发文章理解为一类,就是我今天发布内容了,那么发布内容的当天数据肯定时要比之后两天要高的。【这是什么原因呢?】很简单,我们在读公众号文章的时候,因为当天是有推送的,所以我们都是读当天的,我们很少会去向前翻很久去浏览一篇之前的文章。这是大家的浏览习惯造成的,但是即便今天仅仅发布的是视频,没有阅读原文按钮,但是还会有一部分看了视频的人去点击其他部分,这就导致了发视频当天数据也会有一个增长。

1人觉得有帮助 有帮助
2022-10-02 15:53

谷歌分析的课程在哪里可以看到?

英英老师 2022-10-02 23:47

https://www.nuanshi100.com/credits/w34.html这个是暖石的课程, https://support.google.com/analytics/?hl=zh-Hans#topic=10737980这个是谷歌的帮助中心,两个可以结合看。

0人觉得有帮助 有帮助
2022-07-09 15:11

1.阅读原文点击率=阅读原文点击人数/文章的完读人数
2.完读率=文章的完读人数/文章的阅读人数(点击文章人数)
3.点击率=文章的阅读人数/推文送达人数

老师,可以这么算吗?还是说除以次数?

我看到提问区和课程视频里的公式不太一样,所以有点懵。

英英老师 2022-07-10 21:32

可以这样算,最后结果是接近一样的。

0人觉得有帮助 有帮助
2022-07-03 12:12

刷选没有发文日子是自己重新找吗

英英老师 2022-07-03 22:11

你自己工作中哪天没发文,自己是知道的啊。对于作业来说,直接看哪天没发即可。

usit 2022-07-04 07:30
那对于这个作业给出的4—6月的单篇数据,里面的是都发文的呗,就不用筛选了吧, 要是筛选的话,是自己从新列表格填吗
沐沐老师 2022-07-04 11:40

是的,表格中出现的数据都是当天已经发文的,但里面除了图文内容外还有发布的视频等数据,要按照作业要求计算数据的话还是需要在表格中筛选处理的。

【 要是筛选的话,是自己从新列表格填吗】如果同学有这个需求,直接复制原有表格到自己的表格中进行后续处理即可。

0人觉得有帮助 有帮助
2022-05-16 11:47

(当天发文的阅读原文数)是指新发布文章的阅读原文数量么?是指哪个入口呢?还是只要看了新文章原文的都算进去?

菜单栏阅读原文数是指哪个入口数量呢?这个不是很清楚。

 

筱筱老师 2022-05-16 18:09

同学你好,

【(当天发文的阅读原文数)是指新发布文章的阅读原文数量么?是指哪个入口呢?还是只要看了新文章原文的都算进去?】这个当天发文中的阅读原文数,指的就是点击这篇文章末尾的“阅读原文”的人数。

【菜单栏阅读原文数是指哪个入口数量呢?这个不是很清楚。】指的是通过菜单栏中的文章点击了末尾“阅读原文”的人数。

0人觉得有帮助 有帮助
2022-05-14 13:34

老师你好,不是很明白为什么数据清洗需要把历史阅读原文人数的数据也清洗掉。历史阅读原文人数本身也包含在通过推文点击阅读原文的人数中,为什么不直接看菜单分析的人数占当天总阅读原文人数的占比,然后把菜单分析的阅读原文人数清除掉?

英英老师 2022-05-15 11:16

因为用户来源不同,导致质量不同,关注点不同,行为也会完全不同。某类用户占阅读总数的10%,不一定意味着他们就一定占点击原文总数的10%。

0人觉得有帮助 有帮助
2022-03-18 14:40

我有一个疑问:

按照课程里提到的,【所有未发文日子(主要指发文2天后)阅读原文数据之和  ➗ 所有发文日子(包括发文2天及以内)阅读原文数据之和】,这个比率用来计算菜单栏及历史文章阅读原文数在整体阅读原文数中的分量,继而来判断是否有必要进行数据清洗。

可是,所有发文日子(包括发文2天及以内)所产生的阅读原文数,本身就有一部分是来自于菜单栏及历史文章的,这部分数据自己就并“不干净”,所以这个算法真的准确吗?

英英老师 2022-03-18 21:30

课程此处说得有些理想,我们正在制作新版的数据分析课程。

在这里,你可以这样理解,只要是发文一天之后的数据,都可以近似地作为可用数据来分析转发率打开率等,在99%的公司场景下,是不需要做数据清洗的。

0人觉得有帮助 有帮助
2022-03-12 10:10

老师好,如果按视频里说的,验证下来可以将当天有发文的阅读原文数全部视作发文带来的数据,那发文后第2天的数据怎么来对待呢?第2天还是有前一天发文带来的数据的,但是相对来说占比又没有那么大了。麻烦老师解答,谢谢。

英英老师 2022-03-12 17:57

实际工作中,第二天的数据可以忽略掉,就不统计了。或者每周统计一次这个内容的周总阅读转发等数据。

爱吃年糕 2022-03-12 19:08
哦,还有个问题就是,如果“脏数据”占比比较大的话该怎么处理呢?是只能借用第三方工具检测了么?如果公司没有用第三方工具该怎么办呢?
英英老师 2022-03-12 23:06

实际工作中,那这次就干脆不要分析了。新媒体的数据分析本来就只能近似准确,不可能完全科学,所以真的脏到这份儿上就只能算了。

爱吃年糕 2022-03-13 10:08
什么叫不要分析了呀 ?不好意思没太明白,那也不能说这个月或这个周的数据全都放弃掉了呀?
英英老师 2022-03-13 10:35

不是这个月的就放弃,而是这条内容就不分析或者简单分析了,然后先去解决一下数据污染的问题。

爱吃年糕 2022-03-13 11:26
按照视频里的讲解,看脏数据是否占比较多,是用一个周期内 黄色的部分总和/白色的部分总和 对吧?我的意思是,如果得出的脏数据占比较大,就不能忽略掉,就不能认为当天的阅读原文数全部来自发文的阅读原文数了,那具体该怎么分析呢?不知道我描述清楚了吗?
英英老师 2022-03-14 02:56

你描述清楚了,如果脏数据太多,实际上就应该放弃分析,去做一些脏数据少的内容,然后再分析,在脏数据上耗费太多时间已经没有意义。

0人觉得有帮助 有帮助
2022-03-07 11:06

老师,你好

数据清洗是否每次发文都要去做?

琳西老师 2022-03-07 11:39

同学好,工作中我们一般不会经常去做数据分析,可能1个月、也可能几个月一次,每次要分析数据时清洗即可,不需要每次发文都去做。

想转运营 2022-03-07 18:39
在一个月中,不断的去发文,公众号的用户增量肯定会比上一次的增多,那如何确保【历史文章阅读原文+菜单栏文章的阅读原文】就不会增加呢?还是随着用户体量的不断增加,当天发文,历史文章,菜单栏文章都在增加,占比还是不变?
琳西老师 2022-03-07 22:09

我们这一步是处理脏数据,不需要考虑数据是否增加,看的是这一个月数据的总和占比是高还是低,不需要看变化。


如果我们分析一个月之后 还需要分析两个月,才需要考虑同学说的问题,一般如果不做运营动作上的调整,不管是一个月还是两个月 占比肯定是相近的。同学的理解是正确的。

0人觉得有帮助 有帮助
2022-02-28 15:37

老师,这里不懂,是用总的阅读数减去标红和标黄就可以大概估算出实际通过推文阅读原文的数据吗

沐沐老师 2022-02-28 20:58

同学好,【是用总的阅读数减去标红和标黄就可以大概估算出实际通过推文阅读原文的数据吗】不是的哈,小伙伴可以看看下面的步骤:

1)有推送【文章】的那天(未标注颜色),阅读原文数的组成是【当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

2)发了【文章】(未标注颜色)的第二天,因为依旧还有很多人来看到这篇文章,所以阅读原文数的组成是【前一天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

3)发了【文章】之后的第三天开始(标黄色),基本上就没人再看这篇文章了,所以阅读原文数的组成是【菜单栏的阅读原文数+很久之前文章中的阅读原文数】

4)没有发文(标注红色),以及发布视频(标注红色)无阅读原文数据

可以看到,先剔除4)的数据,也就是直接忽略,然后用3)的数据除以1)的数据,可以知道不受发文数据影响的阅读人数占总量的占比为多少。如果占比很低,可以忽略不计。如此计算下来就是9%。

0人觉得有帮助 有帮助
2022-01-11 23:37

老师,我不是很能理解清洗数据中,标黄数据/标白数据,比例低于9%以后,就可以默认为:【当天的原文阅读量,都是当天推文带来】的逻辑

我的理解:

标黄数据=【菜单栏】+【2天前的历史推文】

标白数据=【当天推文】+【前1天推文】+【前2天推文】+【菜单栏】+【2天前的历史推文】

标黄数据/标白数据的占比低,应该可以推导出:每天的原文阅读量对【当天推文】+【前1天推文】+【前2天推文】的影响较大,无法排出前2天的推文带来的影响

 因此,视频+不发文的日子,阅读原文点击率也很高,因为是【前1天推文】+【前2天推文】带来的影响

所以按照课程给的逻辑,我无法理解阅读原文的点击率都是由【当天推文】带来的我认为无法排出前2天的推文带来的影响

思思老师 2022-01-12 11:08

同学你好,

同学首先需要知道一个前提:暖石网这个账号并不是天天发文的,大多数日子是不发文的。

在这个基础上,同学还需要理解三个情况:

(1)有推送【文章】的那天(注意:是推送【文章】,不是【视频】,【视频】是没有阅读原文的设置的),阅读原文数的组成是【当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

(2)发了【文章】(不是【视频】)的第二天,因为依旧还有很多人来看到这篇文章,所以阅读原文数的组成是【前一天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】

(3)发了【文章】之后的第三天开始,从以往的数据观察,基本上就没什么人再看这篇文章了,所以阅读原文数的组成是【菜单栏的阅读原文数+很久之前文章中的阅读原文数】

9%是对比整体所有数据中,发文日子和没发文日子的阅读原文数数据比,就是所有未发文日子阅读原文数据之和  ➗ 所有发文日子阅读原文数据之和。目的是为了避免误差,进行的总数据汇总。

表格中只截取了部分,所以仅按照截取的部分的数据算,是没有9%的,筛选方式就是课程中的步骤和上述的内容。

范范28 2022-01-12 13:52
1、【同学首先需要知道一个前提:暖石网这个账号并不是天天发文的,大多数日子是不发文的。】 数据表格给的数据很多都是日期连在一起的,如果数据都间隔比较远,我也不会有此次的疑问了 2、【有推送【文章】的那天(注意:是推送【文章】,不是【视频】,【视频】是没有阅读原文的设置的),阅读原文数的组成是【当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】 同样:基于原始数据表格中,很多文章都是每天连续发的,所以,当天发文 无法剔除前2天文章带来的影响,所以我无法认同:有推送【文章】阅读原文数=当天发文中的阅读原文数+菜单栏的阅读原文数+很久之前文章中的阅读原文数】 3、总的来说,可能老师给的前提【大多数日子不发文】是和给的表格数据是冲突的,所以产生了疑问
思思老师 2022-01-12 15:20

同学好,

1、我们首先看一下:【标黄】和【标白】相比,到底是为了什么

课程中我们说到的公式是阅读原文人数=当天发文带来的人数+【菜单栏带来的人数+历史文章的人数】

标黄的数据:是发文两天后的数据,但是有一个前提是这个数据前两天是没有文章推送的,即你截图的4月6号的数据,可以看到4月5号没有发文、4月4号发的是视频,不是文章,视频没有阅读原文,所以4月6号这个数据是纯粹的,没有被污染的;

标红的数据:是没有推送日子和发视频的日子

标白色的数据:是发文的日子

那么标黄和表白比:是为了看【菜单栏带来的人数+历史文章的人数】这部分数据,占整体的比重有多大

2、其次,咱们在选取样本量的时候,要保证索取的样本的纯粹。

像你框柱的4月4号的数据,虽然是1号发文后两天。但是,2号和3号还有发文,这个4月4号的数据是被前两天污染的,它不能作为样本量去做计算。同理,4月14号、4月16号的数据,也是被污染的数据。如果用被污染的数据作为样本数据去计算,那结论是不准确的。

范范28 2022-01-12 16:09
老师,你的回答不是我的疑问 1、我理解标黄和标白数据的含义,也理解【标黄和标白比:是为了看【菜单栏带来的人数+历史文章的人数】这部分数据,占整体的比重有多大】 2、我不能理解的是,标黄和标白经过对比,可以的出,标白的数据:就是发文当天的文章带来的数据 3、就像我前面提到的,原始表格数据中给出的很多文章都是连续发送的,所以不能排除前两天推文带来的影响 而老师第一次回答中,对于这个疑问给的前提是【公众号文章不是天天发的】,我认为这2者有冲突
思思老师 2022-01-12 17:45

刚刚微信联系了同学,同学接下来还有什么问题欢迎和老师沟通~

0人觉得有帮助 有帮助
2022-01-06 16:07

我有个疑问,直接问了啊。算出来脏数据(也就是并非该篇文章带来的阅读原文数)9%,然后这个数据会怎么被使用?

半亩老师 2022-01-06 17:44

同学好,这个9%算出来就是为了看一下它占比高不高,没超过10%就算不高,脏数据可以忽略不计。后面这个9%就没用了。

0人觉得有帮助 有帮助
2021-12-03 15:45

老师请问这个是老师回答其他同学的答案,发现老师红框里圈的是发文后第三天的数据,但是我统计的这10篇文章,是没有出现第三天没发文的情况 ,应该要怎么算了呢?

没发文的日子阅读原文数总和/发文的日子阅读原文数总和  那这里发文的日子要算上发视频的日子吗?

果儿 2021-12-03 22:30

问题1刚才回答过了,不说了。

问题2:【没发文的日子阅读原文数总和/发文的日子阅读原文数总和  那这里发文的日子要算上发视频的日子吗?】——这里是不算发视频的日子的,因为视频没有「阅读原文」,所以在计算原文跳转率的时候就不算发视频的日子。

0人觉得有帮助 有帮助
2021-12-03 15:40

老师请问这个是老师回答其他同学的答案,发现老师红框里圈的是发文后第三天的数据,但是我统计的这10篇文章,是没有出现第三天没发文的情况 ,应该要怎么算了呢

果儿 2021-12-03 22:22

同学,你这个5月24号、5月31号、6月7号,不都是发文后的第3天么?

我们之所以要卡发文后的第三天,是因为通常来讲,一个文章发完后的2天之内都还是有人从文章直接点进来看的,但是两天之后的自然流量就几乎很少了,大部分是从历史文章菜单栏里来的了。所以咱们有第三天的就统计出来,没有第三天的我们就不考虑这个清洗维度了。不知道老师有解释清楚没有。

0人觉得有帮助 有帮助
零基础转行系统课