Politics.be

Politics.be (https://forum.politics.be/index.php)
-   Economie (https://forum.politics.be/forumdisplay.php?f=179)
-   -   De motor van de zoekrobot Google = het PageRank algoritme => PR(A) (https://forum.politics.be/showthread.php?t=238467)

Nr.10 26 april 2017 11:18

De motor van de zoekrobot Google = het PageRank algoritme => PR(A)
 
1 Bijlage(n)
PR(A) = de PageRank van een bepaalde pagina op het internet. Een getal tussen 0 en 10.

Het PageRank algoritme:

Nr.10 26 april 2017 18:45

1 Bijlage(n)
Hoe wordt de PR berekend?
PageRank-berekening
De PageRank van een bepaalde pagina A PR(A) kan worden opgevat als de waarschijnlijkheid dat een surfer op deze pagina terechtkomt wanneer die surfer willekeurige hyperlinks aanklikt en af en toe een nieuwe pagina opvraagt. De PageRank is een van de parameters waarop het Google-zoekmodel is gebaseerd. Met het Google-zoekmodel wordt bedoeld: het technisch model dat ervoor zorgt dat zoekresultaten bij een bepaalde zoekterm (Engels: 'search query') van geïndexeerde en door Google als belangrijk veronderstelde pagina's geordend worden naar belangrijkheid. PageRank is echter zeker niet de enige 'search ranking factor' in het Google-zoekmodel waardoor de volgorde van Google-zoekresultaten niet de facto overeenkomt met de (aflopende) PageRank-volgorde van relevante pagina's uit die zoekresultaten.

Mathematisch

De pagina's in het wereldwijde web worden beschouwd als knopen in een gerichte graaf. Elke hyperlink van een pagina X naar pagina A is dan een boog in deze graaf van knoop X naar knoop A en kan worden opgevat als een "stem" van pagina X voor pagina A. Als er veel pagina's naar A linken, wordt A "populairder", d.w.z. stijgt de PageRank van A. Maar de PageRank van A hangt niet alleen af van het aantal "stemmen" (hyperlinks naar A), maar ook van de populariteit van de pagina's die hun stem uitbrengen, dus van de PageRank van die pagina's die naar A linken. De PageRank van pagina A wordt dan volgens het originele concept van Page en Brin berekend met de volgende formule:

Nr.10 26 april 2017 18:50

waarbij
  • P R ( x ) = de PageRank van pagina x
  • C ( x ) = het aantal uitgaande links van pagina x
  • P 1 , P 2 , . . . P n = de pagina's die naar pagina A verwijzen of die A "citeren"
  • d = een dempingsfactor, tussen 0 en 1 (standaard d=0.85)
De dempingsfactor d brengt het toevalselement in. Het stelt de waarschijnlijkheid voor dat de surfer het achtereenvolgens blijven klikken op hyperlinks moe wordt en een nieuwe, willekeurig gekozen startpagina opvraagt.

De berekening van PageRanks is iteratief. Om te beginnen krijgt elke pagina een startwaarde, bijvoorbeeld gelijk aan 1 / P (met P het totaal aantal pagina's). Met bovenstaande formule wordt dan een nieuwe PageRank berekend voor elke pagina. Dit wordt herhaald tot er convergentie optreedt en de nieuwe waarden voldoende dicht bij de vorige waarden liggen. PageRanks worden periodiek, offline (her)berekend.

Hoe kan de PageRank van pagina A worden verhoogd?

Dat kan door ervoor te zorgen dat er veel andere pagina's naar pagina A verwijzen (dus zo veel mogelijk citaties T): link building. Best zijn deze citaties uniek op desbetreffende pagina (dus C ( T ) zo laag mogelijk). Om hoge PageRanks te verkrijgen ontstonden fenomenen als "link farms", groepen van webpagina's of van hele websites met veel onderlinge hyperlinks, bedoeld om een hoge PageRank en een prominente plaats in de zoekresultaten van Google te verkrijgen. Google herkent ondertussen dergelijke linkfarms echter en brengt ze niet in rekening.

Nr.10 26 april 2017 20:48

link terminologie
 
1 Bijlage(n)
PageRank draait rond links. Bijgevolg, als het allemaal rond links draait, ontstaat er een hele link terminologie.

De term backlink bijvoorbeeld:
"In basic link terminology, a backlink is any link received by
a web node (web page, directory, website, or top level domain)
from another web node (Björneborn and Ingwersen, 2004).
Backlinks are also known as incoming links, inbound links, inlinks,
and inward links."
BRON

Nr.10 28 april 2017 20:19

1 Bijlage(n)
Tot een jaar geleden [maart 2016] werd de PageRank data vermeld in de Google Toolbar.
Google explained that the company still uses PageRank data internally within the ranking algorithm, but the external PageRank values shown in the Toolbar are going away completely. BRON

Nr.10 28 april 2017 22:57

1 Bijlage(n)
PR(A) = de PageRank van een bepaalde pagina op het internet.
Een getal tussen 0 en 10.

Er wordt aangenomen dat het de PR [tussen 0 en 10]
betrekking heeft op een achterliggend PR-getal [op een logaritmische schaal].

Meer info hierover:
So how much additional PageRank do we need to move up the toolbar?
(fig.)

Nr.10 28 april 2017 23:33

Hieronder de publicatie die aan de grondslag ligt van de zoekmachine van Google. Deze publicatie is tot stand gekomen aan de universiteit van Stanford.
The Anatomy of a Large-Scale Hypertextual Web Search Engine
Computer Science Department
Stanford University
1998

Nr.10 13 augustus 2017 01:45

1 Bijlage(n)
Let’s Try to Find All 200 Parameters in Google Algorithm
18 dec 2009


Alle tijden zijn GMT +1. Het is nu 17:26.

Forumsoftware: vBulletin®
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Content copyright ©2002 - 2020, Politics.be