google的排序

版主: kazaawangwh

弃婴千枝
论坛支柱
论坛支柱
帖子互动: 1402
帖子: 13447
注册时间: 2022年 7月 27日 10:51

#21 Re: google的排序

帖子 弃婴千枝 »

larvender 写了: 2025年 3月 21日 12:40 那没有学过线性代数,更没学过群论
学的高等数学还是比较简单的那种

没有要干什么,单纯就是想知道如何操纵google ranking
是不是有专门的公司干这种事
我佬可以干----如果是single case的话

如果是multicase,可以教你,你自己干或者开公司干,

但是牢记,这是见不得光的行业,跟贩毒一样
larvender楼主
著名点评
著名点评
帖子互动: 237
帖子: 3901
注册时间: 2022年 7月 23日 12:56

#22 Re: google的排序

帖子 larvender楼主 »

是大批量。。。
那肯定是见不得光的行业
属于造假的范围,那有没有办法证明造假了呢?

弃婴千枝 写了: 2025年 3月 21日 12:42 我佬可以干----如果是single case的话

如果是multicase,可以教你,你自己干或者开公司干,

但是牢记,这是见不得光的行业,跟贩毒一样

混一天算一天

hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 886
帖子: 18790
注册时间: 2022年 7月 23日 23:48

#23 Re: google的排序

帖子 hahan »

larvender 写了: 2025年 3月 21日 12:04 哦,好吧,那就是比较难操纵
google还是很厉害的

你这娃有时还不错,哈哈
我说的这些
你能理解并且接受
我说的其他的
Either 你不能理解or 你不能接受

再说两句Google search
把网页扒下来在加索引
这很简单
但为什么都Google 不用bing ?
就算好用
这个好用
在绝大部分情况
就是你在第一页的前5个link 就能找到你想要的东西
对Google 来说
不仅要让你觉得好用
还得赚钱
这都是search ranking 的know how
现在这个系统已经复杂到没有人理解它是怎么工作的
Google search 内部的人
负责人
创始人
也搞不清楚
他们也是只能依靠statistical control
急急如丧家之犬
忙忙似漏网之鱼
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 886
帖子: 18790
注册时间: 2022年 7月 23日 23:48

#24 Re: google的排序

帖子 hahan »

弃婴千枝 写了: 2025年 3月 21日 12:42 我佬可以干----如果是single case的话

如果是multicase,可以教你,你自己干或者开公司干,

但是牢记,这是见不得光的行业,跟贩毒一样
又吹牛
Seo统计显著的有用
那已经10年前了
你要能game Google search 你早发大财了
现在宣称的seo 都是中医
急急如丧家之犬
忙忙似漏网之鱼
弃婴千枝
论坛支柱
论坛支柱
帖子互动: 1402
帖子: 13447
注册时间: 2022年 7月 27日 10:51

#25 Re: google的排序

帖子 弃婴千枝 »

larvender 写了: 2025年 3月 21日 12:47 是大批量。。。
那肯定是见不得光的行业
属于造假的范围,那有没有办法证明造假了呢?
没有
我给你举个例子
1979年有个黑白电影--海外赤子,里面有个歌曲“我爱你中国”
40多年来一直是这个电影

结果汪峰写了首同名的歌,于是今天你搜索我爱你中国,
竟然作者是汪峰,。。

这叫search engine污染,你看正常的关联网络
图片

你插入一个新的node,拼命点击,这个network就变了,不但有了新node,里面关系也变了

大致就是这个思想
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 886
帖子: 18790
注册时间: 2022年 7月 23日 23:48

#26 Re: google的排序

帖子 hahan »

弃婴千枝 写了: 2025年 3月 21日 12:52 没有
我给你举个例子
1979年有个黑白电影--海外赤子,里面有个歌曲“我爱你中国”
40多年来一直是这个电影

结果汪峰写了首同名的歌,于是今天你搜索我爱你中国,
竟然作者是汪峰,。。

这叫search engine污染,你看正常的关联网络
图片

你插入一个新的node,拼命点击,这个network就变了,不但有了新node,里面关系也变了

大致就是这个思想
你还是别漏切了
你不懂
急急如丧家之犬
忙忙似漏网之鱼
larvender楼主
著名点评
著名点评
帖子互动: 237
帖子: 3901
注册时间: 2022年 7月 23日 12:56

#27 Re: google的排序

帖子 larvender楼主 »

厉害
google的确是好用

hahan 写了: 2025年 3月 21日 12:48 我说的这些
你能理解并且接受
我说的其他的
Either 你不能理解or 你不能接受

再说两句Google search
把网页扒下来在加索引
这很简单
但为什么都Google 不用bing ?
就算好用
这个好用
在绝大部分情况
就是你在第一页的前5个link 就能找到你想要的东西
对Google 来说
不仅要让你觉得好用
还得赚钱
这都是search ranking 的know how
现在这个系统已经复杂到没有人理解它是怎么工作的
Google search 内部的人
负责人
创始人
也搞不清楚
他们也是只能依靠statistical control

混一天算一天

forecasting
著名点评
著名点评
帖子互动: 344
帖子: 4358
注册时间: 2023年 4月 17日 08:26

#28 Re: google的排序

帖子 forecasting »

larvender 写了: 2025年 3月 19日 13:27 问个问题
用 google搜索,搜出来排前后是根据什么?是根据相关性,网站点击率?

google有没有像百度一样的竞价排名?
原先的核心算法是pagerank。也有考虑点击率的。但实际用的是调参数,参数的数量很恐怖,商业机密,据说百万参数都是小意思。

现在的deeplearning差不多可以代替搜索了。google原先没有竞价排名,现在也应该也没有。有竞价排名,即没法用了,很烦的。
弃婴千枝
论坛支柱
论坛支柱
帖子互动: 1402
帖子: 13447
注册时间: 2022年 7月 27日 10:51

#29 Re: google的排序

帖子 弃婴千枝 »

我佬第一个指出,第三方没有特权的用户,也能知道论坛其他用户的ip

我佬第一个指出,第三方用户也能操纵search engine的排序

LOL

不需要知道里面怎么工作的细节
larvender楼主
著名点评
著名点评
帖子互动: 237
帖子: 3901
注册时间: 2022年 7月 23日 12:56

#30 Re: google的排序

帖子 larvender楼主 »

调参数?所以弃婴说得有可能吗?

forecasting 写了: 2025年 3月 21日 13:00 原先的核心算法是pagerank。也有考虑点击率的。但实际用的是调参数,参数的数量很恐怖,商业机密,据说百万参数都是小意思。

现在的deeplearning差不多可以代替搜索了。google原先没有竞价排名,现在也应该也没有。有竞价排名,即没法用了,很烦的。

混一天算一天

头像
ɓuoɥɔɓuɐnɥ(poɓᴉuɯO pǝʇɹǝʌuI)
已冻结已冻结
帖子互动: 127
帖子: 1352
注册时间: 2024年 9月 27日 23:57

#31 Re: google的排序

帖子 ɓuoɥɔɓuɐnɥ(poɓᴉuɯO pǝʇɹǝʌuI) »

不涉及SEO,原始的pagerank跟最简单的finite state markov chain差不多。把状态的分布函数理解成page打分
¡qooq ƃᴉq ɐ ǝɹɐ no⅄
larvender楼主
著名点评
著名点评
帖子互动: 237
帖子: 3901
注册时间: 2022年 7月 23日 12:56

#32 Re: google的排序

帖子 larvender楼主 »

这图终于显示出来了
貌似也是有道理的

弃婴千枝 写了: 2025年 3月 21日 12:52 没有
我给你举个例子
1979年有个黑白电影--海外赤子,里面有个歌曲“我爱你中国”
40多年来一直是这个电影

结果汪峰写了首同名的歌,于是今天你搜索我爱你中国,
竟然作者是汪峰,。。

这叫search engine污染,你看正常的关联网络
图片

你插入一个新的node,拼命点击,这个network就变了,不但有了新node,里面关系也变了

大致就是这个思想

混一天算一天

弃婴千枝
论坛支柱
论坛支柱
帖子互动: 1402
帖子: 13447
注册时间: 2022年 7月 27日 10:51

#33 Re: google的排序

帖子 弃婴千枝 »

larvender 写了: 2025年 3月 21日 13:21 这图终于显示出来了
貌似也是有道理的
网络连接的计算机,你不知道密码,你是不能往里面写东西的

但是。。。。你think twice,就会发现

所谓search engine,本质上是一台网络连接的计算机,允许没有密码的第三方,写东西。。。就像买提允许我在这里胡说八道发贴,就是一例子、

这些写入search的东西,你可理解为pagerank,or something else。。。都不重要,重要的是,它允许你写东西进去,

这就是internet的弱点---你可以写东西,不然它没法工作

于是什么google还是百度,都是可以操纵的

LOL

你要看不明白就不需要继续了
弃婴千枝
论坛支柱
论坛支柱
帖子互动: 1402
帖子: 13447
注册时间: 2022年 7月 27日 10:51

#34 Re: google的排序

帖子 弃婴千枝 »

比如,发email。。。什么是email?你think twice

所谓email,换句话说,其实就是你的计算机,允许我写东西进去。。你只要开了email服务,我就可以写东西进你的计算机

于是,也可以干别的坏事

这是internet的本质,也是internet的弱点,好多人都不明白这点
larvender楼主
著名点评
著名点评
帖子互动: 237
帖子: 3901
注册时间: 2022年 7月 23日 12:56

#35 Re: google的排序

帖子 larvender楼主 »

这几句话不会看不懂
我不是要学怎么造假,就是想知道可以造假

弃婴千枝 写了: 2025年 3月 21日 13:29 网络连接的计算机,你不知道密码,你是不能往里面写东西的

但是。。。。你think twice,就会发现

所谓search engine,本质上是一台网络连接的计算机,允许没有密码的第三方,写东西。。。就像买提允许我在这里胡说八道发贴,就是一例子、

这些写入search的东西,你可理解为pagerank,or something else。。。都不重要,重要的是,它允许你写东西进去,

这就是internet的弱点---你可以写东西,不然它没法工作

于是什么google还是百度,都是可以操纵的

LOL

你要看不明白就不需要继续了

混一天算一天

弃婴千枝
论坛支柱
论坛支柱
帖子互动: 1402
帖子: 13447
注册时间: 2022年 7月 27日 10:51

#36 Re: google的排序

帖子 弃婴千枝 »

larvender 写了: 2025年 3月 21日 13:37 这几句话不会看不懂
我不是要学怎么造假,就是想知道可以造假
search engine就是把关键词组成一个互联的网络。。。。

比如甲与乙产生了绯闻,这样甲与乙以绯闻关联上了,甲--乙

如果你是乙,你不想上头条,怎么办?

你写一篇文章,说甲其实与丙上了床,不是乙。于是绯闻网络变成甲--乙--丙了

然后慢慢地你推出乙那天在与丁上床,于是网络变成甲--丙,乙---丁
这时候甲--乙的关联就break up,你就安全了
肚欲鸣(没想到啊没想到)
论坛精英
论坛精英
肚欲鸣 的博客
帖子互动: 793
帖子: 7567
注册时间: 2022年 12月 3日 11:51

#37 Re: google的排序

帖子 肚欲鸣(没想到啊没想到) »

乙---丁 就不上头条了?
Pig get fat, hog get slaught.
幼发拉底鳖抬龟头遥望美国
弃婴千枝
论坛支柱
论坛支柱
帖子互动: 1402
帖子: 13447
注册时间: 2022年 7月 27日 10:51

#38 Re: google的排序

帖子 弃婴千枝 »

肚欲鸣 写了: 2025年 3月 21日 13:45 乙---丁 就不上头条了?
甲是大老板,想象下甲是马云,乙是你,这样乙-丁就去相关,没人关注了
webdriver(不折腾不舒服斯基)
见习点评
见习点评
帖子互动: 79
帖子: 1448
注册时间: 2022年 11月 11日 12:30
来自: 火星

#39 Re: google的排序

帖子 webdriver(不折腾不舒服斯基) »

。。。学习了。。。
forecasting
著名点评
著名点评
帖子互动: 344
帖子: 4358
注册时间: 2023年 4月 17日 08:26

#40 Re: google的排序

帖子 forecasting »

没看过别人说的什么话,但我说的是工业界和科研界知道的关于google和其他搜索引擎搜索排序的已经公开的方法。
任何实际运行的系统或者生产系统都有一些自己特定的工程工艺,要不然,公布了原理,大家就都可以做得一样好了:即使百度不竞价排名,商业化得那么厉害,它的搜索结果也比google差得很远,原因就在于此。调参数是公开的秘密,不过到底是哪些参数就是商业机密了。所谓调参数,就是就搜索结果鉴别之后(这是要有文档/语料或者标注的语料/文档作为训练集的)就各个与排序有关的因素调整权重(机器自动测试各个权重值从而找出近似最优的来,比如就stop word list以外的词做调参,或者哪些词是stopword做调参。跟你讲个笑话,一些理论上认定相关有用的因素,最后实验证明完全无用)。
PageRank只是当初用的核心算法,并不是由它完全决定的,至于后来演化到什么地步,甚或完全抛弃,就没有关注过。
这个问题你可以到STEM或者programming版去问,在这里说,是不是太枯燥?另外,你到底要解决什么问题?是搜索吗?现在基本不值得下功夫了,你做不过google等打公司,而且当初的问题也没多大意思了。如果是做文档/语料,pagerank直接拿来用就是了,比它好用的技术/算法也有一堆。纯粹好奇,自己找点资料看看就行了。pagerank的思想主要是基于平稳随机过程(stationary stochastic process)

@larvender

+4.00 积分 [版主 wh 发放的奖励]
回复

回到 “书歌影视美食游 - 精华区”