分页: 2 / 3
#21 Re: google的排序
发表于 : 2025年 3月 21日 12:42
由 弃婴千枝
larvender 写了: 2025年 3月 21日 12:40
那没有学过线性代数,更没学过群论
学的高等数学还是比较简单的那种
没有要干什么,单纯就是想知道如何操纵google ranking
是不是有专门的公司干这种事
我佬可以干----如果是single case的话
如果是multicase,可以教你,你自己干或者开公司干,
但是牢记,这是见不得光的行业,跟贩毒一样
#22 Re: google的排序
发表于 : 2025年 3月 21日 12:47
由 larvender
是大批量。。。
那肯定是见不得光的行业
属于造假的范围,那有没有办法证明造假了呢?
弃婴千枝 写了: 2025年 3月 21日 12:42
我佬可以干----如果是single case的话
如果是multicase,可以教你,你自己干或者开公司干,
但是牢记,这是见不得光的行业,跟贩毒一样
#23 Re: google的排序
发表于 : 2025年 3月 21日 12:48
由 hahan
larvender 写了: 2025年 3月 21日 12:04
哦,好吧,那就是比较难操纵
google还是很厉害的
你这娃有时还不错,哈哈
我说的这些
你能理解并且接受
我说的其他的
Either 你不能理解or 你不能接受
再说两句Google search
把网页扒下来在加索引
这很简单
但为什么都Google 不用bing ?
就算好用
这个好用
在绝大部分情况
就是你在第一页的前5个link 就能找到你想要的东西
对Google 来说
不仅要让你觉得好用
还得赚钱
这都是search ranking 的know how
现在这个系统已经复杂到没有人理解它是怎么工作的
Google search 内部的人
负责人
创始人
也搞不清楚
他们也是只能依靠statistical control
#24 Re: google的排序
发表于 : 2025年 3月 21日 12:52
由 hahan
弃婴千枝 写了: 2025年 3月 21日 12:42
我佬可以干----如果是single case的话
如果是multicase,可以教你,你自己干或者开公司干,
但是牢记,这是见不得光的行业,跟贩毒一样
又吹牛
Seo统计显著的有用
那已经10年前了
你要能game Google search 你早发大财了
现在宣称的seo 都是中医
#25 Re: google的排序
发表于 : 2025年 3月 21日 12:52
由 弃婴千枝
larvender 写了: 2025年 3月 21日 12:47
是大批量。。。
那肯定是见不得光的行业
属于造假的范围,那有没有办法证明造假了呢?
没有
我给你举个例子
1979年有个黑白电影--海外赤子,里面有个歌曲“我爱你中国”
40多年来一直是这个电影
结果汪峰写了首同名的歌,于是今天你搜索我爱你中国,
竟然作者是汪峰,。。
这叫search engine污染,你看正常的关联网络
你插入一个新的node,拼命点击,这个network就变了,不但有了新node,里面关系也变了
大致就是这个思想
#26 Re: google的排序
发表于 : 2025年 3月 21日 12:55
由 hahan
弃婴千枝 写了: 2025年 3月 21日 12:52
没有
我给你举个例子
1979年有个黑白电影--海外赤子,里面有个歌曲“我爱你中国”
40多年来一直是这个电影
结果汪峰写了首同名的歌,于是今天你搜索我爱你中国,
竟然作者是汪峰,。。
这叫search engine污染,你看正常的关联网络
你插入一个新的node,拼命点击,这个network就变了,不但有了新node,里面关系也变了
大致就是这个思想
你还是别漏切了
你不懂
#27 Re: google的排序
发表于 : 2025年 3月 21日 12:59
由 larvender
厉害
google的确是好用
hahan 写了: 2025年 3月 21日 12:48
我说的这些
你能理解并且接受
我说的其他的
Either 你不能理解or 你不能接受
再说两句Google search
把网页扒下来在加索引
这很简单
但为什么都Google 不用bing ?
就算好用
这个好用
在绝大部分情况
就是你在第一页的前5个link 就能找到你想要的东西
对Google 来说
不仅要让你觉得好用
还得赚钱
这都是search ranking 的know how
现在这个系统已经复杂到没有人理解它是怎么工作的
Google search 内部的人
负责人
创始人
也搞不清楚
他们也是只能依靠statistical control
#28 Re: google的排序
发表于 : 2025年 3月 21日 13:00
由 forecasting
larvender 写了: 2025年 3月 19日 13:27
问个问题
用 google搜索,搜出来排前后是根据什么?是根据相关性,网站点击率?
google有没有像百度一样的竞价排名?
原先的核心算法是pagerank。也有考虑点击率的。但实际用的是调参数,参数的数量很恐怖,商业机密,据说百万参数都是小意思。
现在的deeplearning差不多可以代替搜索了。google原先没有竞价排名,现在也应该也没有。有竞价排名,即没法用了,很烦的。
#29 Re: google的排序
发表于 : 2025年 3月 21日 13:03
由 弃婴千枝
我佬第一个指出,第三方没有特权的用户,也能知道论坛其他用户的ip
我佬第一个指出,第三方用户也能操纵search engine的排序
LOL
不需要知道里面怎么工作的细节
#30 Re: google的排序
发表于 : 2025年 3月 21日 13:05
由 larvender
调参数?所以弃婴说得有可能吗?
forecasting 写了: 2025年 3月 21日 13:00
原先的核心算法是pagerank。也有考虑点击率的。但实际用的是调参数,参数的数量很恐怖,商业机密,据说百万参数都是小意思。
现在的deeplearning差不多可以代替搜索了。google原先没有竞价排名,现在也应该也没有。有竞价排名,即没法用了,很烦的。
#31 Re: google的排序
发表于 : 2025年 3月 21日 13:08
由 ɓuoɥɔɓuɐnɥ
不涉及SEO,原始的pagerank跟最简单的finite state markov chain差不多。把状态的分布函数理解成page打分
#32 Re: google的排序
发表于 : 2025年 3月 21日 13:21
由 larvender
这图终于显示出来了
貌似也是有道理的
弃婴千枝 写了: 2025年 3月 21日 12:52
没有
我给你举个例子
1979年有个黑白电影--海外赤子,里面有个歌曲“我爱你中国”
40多年来一直是这个电影
结果汪峰写了首同名的歌,于是今天你搜索我爱你中国,
竟然作者是汪峰,。。
这叫search engine污染,你看正常的关联网络
你插入一个新的node,拼命点击,这个network就变了,不但有了新node,里面关系也变了
大致就是这个思想
#33 Re: google的排序
发表于 : 2025年 3月 21日 13:29
由 弃婴千枝
larvender 写了: 2025年 3月 21日 13:21
这图终于显示出来了
貌似也是有道理的
网络连接的计算机,你不知道密码,你是不能往里面写东西的
但是。。。。你think twice,就会发现
所谓search engine,本质上是一台网络连接的计算机,允许没有密码的第三方,写东西。。。就像买提允许我在这里胡说八道发贴,就是一例子、
这些写入search的东西,你可理解为pagerank,or something else。。。都不重要,重要的是,它允许你写东西进去,
这就是internet的弱点---
你可以写东西,不然它没法工作
于是什么google还是百度,都是可以操纵的
LOL
你要看不明白就不需要继续了
#34 Re: google的排序
发表于 : 2025年 3月 21日 13:35
由 弃婴千枝
比如,发email。。。什么是email?你think twice
所谓email,换句话说,其实就是你的计算机,允许我写东西进去。。你只要开了email服务,我就可以写东西进你的计算机
于是,也可以干别的坏事
这是internet的本质,也是internet的弱点,好多人都不明白这点
#35 Re: google的排序
发表于 : 2025年 3月 21日 13:37
由 larvender
这几句话不会看不懂
我不是要学怎么造假,就是想知道可以造假
弃婴千枝 写了: 2025年 3月 21日 13:29
网络连接的计算机,你不知道密码,你是不能往里面写东西的
但是。。。。你think twice,就会发现
所谓search engine,本质上是一台网络连接的计算机,允许没有密码的第三方,写东西。。。就像买提允许我在这里胡说八道发贴,就是一例子、
这些写入search的东西,你可理解为pagerank,or something else。。。都不重要,重要的是,它允许你写东西进去,
这就是internet的弱点---
你可以写东西,不然它没法工作
于是什么google还是百度,都是可以操纵的
LOL
你要看不明白就不需要继续了
#36 Re: google的排序
发表于 : 2025年 3月 21日 13:43
由 弃婴千枝
larvender 写了: 2025年 3月 21日 13:37
这几句话不会看不懂
我不是要学怎么造假,就是想知道可以造假
search engine就是把关键词组成一个互联的网络。。。。
比如甲与乙产生了绯闻,这样甲与乙以绯闻关联上了,甲--乙
如果你是乙,你不想上头条,怎么办?
你写一篇文章,说甲其实与丙上了床,不是乙。于是绯闻网络变成甲--乙--丙了
然后慢慢地你推出乙那天在与丁上床,于是网络变成甲--丙,乙---丁
这时候甲--乙的关联就break up,你就安全了
#37 Re: google的排序
发表于 : 2025年 3月 21日 13:45
由 肚欲鸣
乙---丁 就不上头条了?
#38 Re: google的排序
发表于 : 2025年 3月 21日 13:51
由 弃婴千枝
肚欲鸣 写了: 2025年 3月 21日 13:45
乙---丁 就不上头条了?
甲是大老板,想象下甲是马云,乙是你,这样乙-丁就去相关,没人关注了
#39 Re: google的排序
发表于 : 2025年 3月 21日 13:58
由 webdriver
。。。学习了。。。
#40 Re: google的排序
发表于 : 2025年 3月 21日 21:20
由 forecasting
没看过别人说的什么话,但我说的是工业界和科研界知道的关于google和其他搜索引擎搜索排序的已经公开的方法。
任何实际运行的系统或者生产系统都有一些自己特定的工程工艺,要不然,公布了原理,大家就都可以做得一样好了:即使百度不竞价排名,商业化得那么厉害,它的搜索结果也比google差得很远,原因就在于此。调参数是公开的秘密,不过到底是哪些参数就是商业机密了。所谓调参数,就是就搜索结果鉴别之后(这是要有文档/语料或者标注的语料/文档作为训练集的)就各个与排序有关的因素调整权重(机器自动测试各个权重值从而找出近似最优的来,比如就stop word list以外的词做调参,或者哪些词是stopword做调参。跟你讲个笑话,一些理论上认定相关有用的因素,最后实验证明完全无用)。
PageRank只是当初用的核心算法,并不是由它完全决定的,至于后来演化到什么地步,甚或完全抛弃,就没有关注过。
这个问题你可以到STEM或者programming版去问,在这里说,是不是太枯燥?另外,你到底要解决什么问题?是搜索吗?现在基本不值得下功夫了,你做不过google等打公司,而且当初的问题也没多大意思了。如果是做文档/语料,pagerank直接拿来用就是了,比它好用的技术/算法也有一堆。纯粹好奇,自己找点资料看看就行了。pagerank的思想主要是基于平稳随机过程(stationary stochastic process)
@larvender