Schritt 3: YQL (YAHOO QUERY LANGUAGE)
So dass wir identifiziert haben, wo in der Web-Seite unserer
Benutzernamen sind. Jetzt müssen wir nur diese Informationen in einem passierbaren Format zu erhalten. Normalerweise sind Schaber gebaut, indem Sie nur die gesamte Webseite in einem dichten Baum-wie XML-Knoten-Format laden. Dies ist ein Kopfschmerz. Laden einer Webseite in JSON ist viel einfacher, weil es uns erlaubt, Zugriff auf Elemente, die direkt mit der. Operator. Um die Webseite im JSON-Format zu erhalten, gehen wir von Yahoo Query Language verwenden. Im Grunde ist YQL ein Werkzeug öffnen Json von Yahoo Abfrage Webseiten eingebaut. Die eigentliche Sprache ist sehr ähnlich zu MYSQL. Dies ist der Link zu der Konsole:
https://Developer.Yahoo.com/YQL/Console/
Hier ist, wie es aussieht: (Bild 1)
Unsere Abfrage ist also ziemlich geradlinig:
Wählen Sie * aus html wo Url = "https://www.reddit.com/r/arduino/comments/3rixq5/i_programmed_a_robot_arm_to_feed_me_breakfast/" und Xpath ='/ / a [enthält ()
Wählen Sie * bedeutet nur wählen Sie alles aus der Webseite wo die Url = unsere Reddit Thread.
Im Grunde sagt der Xpath, durchsuchen Sie die Seite und jeder Ort, wo wir einen Tag mit einer Klasse von "Autor" haben, zurück.
Wie Sie sehen können, die Abfrage erfolgreich ist und gibt die Benutzernamen zurück wollten wir:(image 2)
Um dieses Ergebnis im JSON-Format zu erhalten, klicken Sie einfach auf die Registerkarte "Json": (Bild 3)