文档章节

提取网页中的所有链接、点击第 n 个链接 - 回复 "刘丽" 的问题

涂孟超
 涂孟超
发布于 2014/09/26 15:37
字数 397
阅读 11
收藏 0
问题来源: http://www.cnblogs.com/del/archive/2009/01/08/1370907.html#1425544

本例效果图:



代码文件:
unit Unit1;

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls, OleCtrls, SHDocVw;

type
  TForm1 = class(TForm)
    WebBrowser1: TWebBrowser;
    ListBox1: TListBox;
    Button1: TButton;
    Button2: TButton;
    Button3: TButton;
    procedure FormCreate(Sender: TObject);
    procedure Button1Click(Sender: TObject);
    procedure Button2Click(Sender: TObject);
    procedure Button3Click(Sender: TObject);
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

{控件初始化}
procedure TForm1.FormCreate(Sender: TObject);
begin
  WebBrowser1.Align := alTop;
  WebBrowser1.Navigate('http://del.cnblogs.com');
  ListBox1.Align := alClient;

  Button1.Caption := '提取网页所有链接地址';
  Button2.Caption := '提取网页所有链接文本';
  Button3.Caption := '模拟点击指定的链接';
end;

{提取网页所有链接地址}
procedure TForm1.Button1Click(Sender: TObject);
var
  i: Integer;
begin
  ListBox1.Clear;
  for i := 0 to WebBrowser1.OleObject.document.anchors.Length - 1 do
    ListBox1.Items.Add(WebBrowser1.OleObject.document.anchors.item(i).href);
end;

{提取网页所有链接文本}
procedure TForm1.Button2Click(Sender: TObject);
var
  i: Integer;
begin
  ListBox1.Clear;
  for i := 0 to WebBrowser1.OleObject.document.anchors.Length - 1 do
    ListBox1.Items.Add(WebBrowser1.OleObject.document.anchors.item(i).innerText);
end;

{模拟点击指定的链接}
procedure TForm1.Button3Click(Sender: TObject);
begin
//  WebBrowser1.OleObject.document.anchors.item(0).click; {假如是第一个链接}
  if ListBox1.ItemIndex <> -1 then
    WebBrowser1.OleObject.document.anchors.item(ListBox1.ItemIndex).click;

  ListBox1.Clear;
end;

end.

 
 
 
 
 

 

 

  

窗体文件:
object Form1: TForm1
  Left = 0
  Top = 0
  Caption = 'Form1'
  ClientHeight = 229
  ClientWidth = 626
  Color = clBtnFace
  Font.Charset = DEFAULT_CHARSET
  Font.Color = clWindowText
  Font.Height = -11
  Font.Name = 'Tahoma'
  Font.Style = []
  OldCreateOrder = False
  OnCreate = FormCreate
  PixelsPerInch = 96
  TextHeight = 13
  object ListBox1: TListBox
    Left = 8
    Top = 127
    Width = 185
    Height = 130
    ItemHeight = 13
    TabOrder = 4
  end
  object WebBrowser1: TWebBrowser
    Left = 8
    Top = 8
    Width = 300
    Height = 113
    TabOrder = 0
    ControlData = {
      4C000000021F0000AE0B00000000000000000000000000000000000000000000
      000000004C000000000000000000000001000000E0D057007335CF11AE690800
      2B2E126208000000000000004C0000000114020000000000C000000000000046
      8000000000000000000000000000000000000000000000000000000000000000
      00000000000000000100000000000000000000000000000000000000}
  end
  object Button1: TButton
    Left = 451
    Top = 127
    Width = 151
    Height = 25
    Caption = 'Button1'
    TabOrder = 1
    OnClick = Button1Click
  end
  object Button2: TButton
    Left = 451
    Top = 158
    Width = 151
    Height = 25
    Caption = 'Button2'
    TabOrder = 2
    OnClick = Button2Click
  end
  object Button3: TButton
    Left = 451
    Top = 189
    Width = 151
    Height = 25
    Caption = 'Button3'
    TabOrder = 3
    OnClick = Button3Click
  end
end

 
 
 
 
 

 

 

  

本文转载自:http://www.cnblogs.com/del/archive/2009/01/08/1371867.html

共有 人打赏支持
涂孟超
粉丝 12
博文 2011
码字总数 14107
作品 0
深圳
程序员
rvest包爬取猎聘网招聘信息

前言 前不久,我用rvest包爬取了政府工作报告,通过jiebaR分词,并用wordcloud2进行了词云分析。点击查看 http://blog.csdn.net/wzgl_wh/article/details/72804687 今天,我们来用rvest包爬取...

wzgl__wh
2017/07/10
0
0
Python多篇新闻自动采集

昨天用python写了一个天气预报采集,今天趁着兴头写个新闻采集的。   目标是,将腾讯新闻主页上所有新闻爬取下来,获得每一篇新闻的名称、时间、来源以及正文。   接下来分解目标,一步一...

阿锋zxf
01/13
0
0
网盘万能钥匙:百度网盘提取密码自动填写

前言 每次下载百度网盘私密分享的文件时都需要填写提取码,虽然不麻烦,但是如果能自动填写的话倒也省了不少事。 最近正好在 v2ex 上看到有大神写了个“百度网盘提取码自动识别与分享工具 --...

己立
2017/11/08
0
0
python数据挖掘案例系列教程——python实现搜索引擎

全栈工程师开发手册 (作者:栾鹏) python数据挖掘系列教程 今天我们使用python实现一个网站搜索引擎。主要包含两个部分。网站数据库的生成、搜索引擎。其中搜索引擎部分我们使用单词频度算...

luanpeng825485697
01/07
0
0
计算机基础导论 学习总结 上

课程大纲:从构建一个简单的搜索引擎项目出发,介绍构建过程中需要用到的技术,大致分为三个部分: 爬取数据 建立索引 页面排序 第一单元 开始你的第一行代码 课程前三个单元的目标是创建一个...

Nautilus1
2017/11/28
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

谈谈神秘的ES6——(五)解构赋值【对象篇】

上一节课我们了解了有关数组的解构赋值相关内容,这节课,我们接着,来讲讲对象的解构赋值。 解构不仅可以用于数组,还可以用于对象。 let { foo, bar } = { foo: "aaa", bar: "bbb" };fo...

JandenMa
18分钟前
0
0
OSChina 周一乱弹 —— 有人要给本汪介绍妹子啦

Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 @莱布妮子 :分享水木年华的单曲《中学时代》@小小编辑 手机党少年们想听歌,请使劲儿戳(这里) @须臾时光:夏天还在做最后的挣扎,但是晚上...

小小编辑
25分钟前
5
1
centos7安装redis及开机启动

配置编译环境: sudo yum install gcc-c++ 下载源码: wget http://download.redis.io/releases/redis-3.2.8.tar.gz 解压源码: tar -zxvf redis-3.2.8.tar.gz 进入到解压目录: cd redis-3......

hotsmile
47分钟前
0
0
PopupWindow总结和通用PopupWindow

PopupWindow 注意点: 设置PopupWindow的宽高,容易忘记,没有设置宽高在某些情况下会不展示。 基础设置少不了 pop.setBackgroundDrawable(new BitmapDrawable());pop.setFoucusable(true)...

DaSheng丶
55分钟前
0
0
Confluence 6 数据库和临时目录

数据库 所有的其他数据库,包括有页面,内容都存储在数据库中。如果你安装的 Confluence 是用于评估或者你选择使用的是 Embedded H2 Database 数据库。数据库有关的文件将会存储在 database...

honeymose
今天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部