excel vba 抓取网页数据

2024-05-20 06:09

1. excel vba 抓取网页数据

这个的话
你必须要对excel里面的VBA的很熟悉啊
你可以去excel home里面询问一些VBA高手啊
这里很难遇到啊

excel vba 抓取网页数据

2. Excel 如何用VBA提取网页数据

1、首先打开Excel 2007工作表,点击想要把数据导入的位置,然后在菜单栏找到第五项'数据“,点击,在“获取外部数据”项下找到“自网站”并点击。
2、这时弹出来”新建 Web 查询“对话框,可以在“地址”一栏键入要添加数据的网页的地址。
3、添加完成后,点击“转到(G)”,下面会出来要添加网页的内容和黄色箭头,单击要选择的表旁边的黄色箭头,可以看到点击后黄色箭头变成绿色的对号,这表示内容已经选中了,然后单击“导入(I)”。
4、弹出来”导入数据“对话框,设置完成点击“确定”。
5、Excel表中显示“正在获取数据……”。
6、数据获取完成,之前选中的网页内容全部导入了Excel工作表里。

3. Excel vba如何抓取指定的网页数据到单元格

参考:
Sub A1下载数据()
ReDim A2(1 To 200000, 1 To 15): A = 0
For i = 1 To 5
Sleep 2000 + 1000 * Rnd
With CreateObject("WinHttp.WinHttpRequest.5.1")
URL = "目标网页" 
.Open "get", URL, False
.setRequestHeader "Host", "xxxxx"
.Send
Q1 = .responseText
Q1 = Replace(Q1, """", "")
Q1 = Replace(Q1, Chr(9), "")
Q1 = Replace(Q1, Chr(10), "")
Q1 = Replace(Q1, Chr(13), "")
Q1 = Replace(Q1, "=odd>", "=>")
End With
'Sheet1.[A2] = Q1
B1 = Split(Q1, "")
For j = 1 To UBound(B1)
B2 = Split(B1(j), "")
B3 = Split(Replace(B2(1), "", ""), ",")
A2(A + 1, 1) = Replace(B2(2), "", "")
A2(A + 1, 2) = Replace(B2(0), "", "")
For K = 0 To 9
A2(A + 1, 3 + K) = B3(K)
Next
A = A + 1
Next
Application.StatusBar = i
Next
MsgBox A
With Sheet1
If .AutoFilterMode = True Then .AutoFilterMode = False
.Rows("2:600000").ClearContents
If A > 0 Then .[A2].Resize(A, 15) = A2
.Rows(1).AutoFilter   '数据筛选
ActiveWindow.ScrollRow = 1
ActiveWindow.ScrollColumn = 1
End With
End Sub

Excel vba如何抓取指定的网页数据到单元格

4. excel2016。如何 vba 抓取网页指定数据,并且自动更新至excel,网页登陆有用户名和密

1、这个问题相对比较专业。建议再去知乎看看
2、另外咨询下淘宝看看卖VBA程序的人都给出什么方案
3、以下代码转载自网络:
Dim http  Set http = CreateObject("Microsoft.XMLHTTP")  http.Open "POST", "连接地址", False  http.send ""  If http.Status = 200 Then    selection.text=http.responseText  End If二是开启IE进程Sub test()  Set ie = CreateObject("InternetExplorer.Application") '设置变量  With ie '设置块    .Navigate ("需要打开的网页的网址") '打开网页    .Visible = True '是否显示ie窗口    While .readystate  4 '延迟等待页面加载完毕      DoEvents    Wend    For i = 22 To 49 Step 3 '取数循环      S = S & " " & .Document.all.tags("td")(i).innerTEXT  '取数据到变量,熟悉HTML的DOM可以修改这个实现各种内容    Next i  End With '块结束  S = LTrim(S) '删除左边空格  Application.SendKeys "^{F4}" '发送按键关闭当前浏览器标签  MsgBox S '显示结果  Set ie = Nothing '释放内存End Sub

5. EXCEL如何用VBA自动获取每个股票近几天的涨幅

  一般网页上的数据都可以通过VBA进行抓取,应用得好,可以实现对很很多资料的动态监测。
  涨幅就是指目前这只股票的上涨幅度。
  涨幅的计算公式:涨幅=(现价-上一个交易日收盘价)/上一个交易日收盘价*100%
  例如:某只股票价格上一个交易日收盘价100,次日现价为110.01,就是股价涨幅为(110.01-100 )/100*100%=10.01%.一般对于股票来说 就是涨停了!如果涨幅为0则表示今天没涨没跌,价格和前一个交易日持平。如果涨幅为负则称为跌幅。
  比如:一支股票的涨幅是:10%、-5%等 。

EXCEL如何用VBA自动获取每个股票近几天的涨幅

6. 怎么用vba抓取excel表格中的数据

你的问题太大了,因为VBA在excel就是抓数据、计算数据的,要看你具体怎么抓。比如抓取特定字段数据,应该用到三个字符串函数:LEFT、RIGHT、MID
1、LEFT函数:
用法:LEFT(要提取字符所在单元格,从左侧开始提取的个数)
例如:=LEFT(A1,2) 意思是从A1单元格提取前两个字符。
2、RIGHT函数:
用法:RIGHT(要提取字符所在单元格,从右侧开始提取的个数)
例如:=RIGHT(A1,2) 意思是从A1单元格提取最后两个字符。
3、MID函数:
用法:MID(要提取字符所在单元格,开始位置,提取个数)
例如:=MID(A1,2,2) 意思是从A1单元格提的第二个单元格开始,提取两个字符,也就提取A1单元格第2个和第3个字符。
注:用MID函数,也可以替代前两个函数,比如:=MID(A1,1,2)与=LEFT(A1,2)的结果是一样的,再比如:=MID(A1,LEN(A1)-2+1,2)与=RIGHT(A1,2)的结果是一样的只是这里用到LEN函数,其作用是取得单元格字符串的长度。
4、提取后的字符合并:
字符合并要用到连接符号:&
比如:=LEFT(A1,2)&RIGHT(A1,2) 意思是把A1单元格的前两个和最后两个字符,提取出来组成一个新的字符。

7. 用VBA实现Excel中数据的提取并且汇总

例子数据源:

程序代码:

运行结果:

是不是很完美,程序文本:
Option Explicit

Sub 转换()
    Dim a1, a2(1 To 1000, 1 To 100), i, j, x, y, m, n
    Set x = CreateObject("Scripting.Dictionary")
    Set y = CreateObject("Scripting.Dictionary")
    a1 = Range("a1").CurrentRegion
    For i = 1 To UBound(a1)
        If a1(i, 1) = "价格" Then
            If Not y.Exists(a1(i, 2)) Then
                a2(1, y.Count + 2) = a1(i, 2)
                y.Add a1(i, 2), y.Count + 2
            End If
            n = y(a1(i, 2))
        Else
            If Not x.Exists(a1(i, 1)) Then
                a2(x.Count + 2, 1) = a1(i, 1)
                x.Add a1(i, 1), x.Count + 2
            End If
            m = x(a1(i, 1))
            a2(m, n) = a1(i, 2)
        End If
    Next i
    Range("d1").Resize(x.Count + 1, y.Count + 1) = a2
End Sub

用VBA实现Excel中数据的提取并且汇总

8. EXCEL VBA获取某个需要登录的网站上的数据

可以通过WebBrowser控件的使用实现该功能
以下实例打开百度,在输入框输入“aaa”
Public Sub useie()
'引用Microsoft Internet Controls
Dim IE
On Error Resume Next
Set IE = CreateObject("InternetExplorer.application")
IE.Visible = True

IE.Navigate URL:=""
timeie = DateAdd("s", 20, Now()) '等待20s
Do While IE.Busy And Not IE.ReadyState = READYSTATE_COMPLETE
DoEvents
If timeie < Now() Then
MsgBox “无法连接重新执行”
IE.Quit
Exit Sub
End If
Loop

IE.Document.getElementById("kw").Value = "aaa"
Set IE = Nothing
Set ID = Nothing
End Sub

WebBrowser控件的使用
0、常用方法
Navigate(string urlString):浏览urlString表示的网址
Navigate(System.Uri url):浏览url表示的网址
Navigate(string urlString, string targetFrameName, byte[] postData, string additionalHeaders): 浏览urlString表示的网址,并发送postData中的消息
//(通常我们登录一个网站的时候就会把用户名和密码作为postData发送出去)
GoBack():后退
GoForward():前进
Refresh():刷新
Stop():停止
GoHome():浏览主页
WebBrowser控件的常用属性:
Document:获取当前正在浏览的文档
DocumentTitle:获取当前正在浏览的网页标题
StatusText:获取当前状态栏的文本
Url:获取当前正在浏览的网址的Uri
ReadyState:获取浏览的状态
WebBrowser控件的常用事件:
DocumentTitleChanged,
CanGoBackChanged,
CanGoForwardChanged,
DocumentTitleChanged,
ProgressChanged,
ProgressChanged

1、获取非input控件的值:
webBrowser1.Document.All["控件ID"].InnerText;
或webBrowser1.Document.GetElementById("控件ID").InnerText;
或webBrowser1.Document.GetElementById("控件ID").GetAttribute("value");

2、获取input控件的值:
webBrowser1.Document.All["控件ID"].GetAttribute("value");;
或webBrowser1.Document.GetElementById("控件ID").GetAttribute("value");

3、给输入框赋值:
//输入框
user.InnerText = "myname";
password.InnerText = "123456";
webBrowser1.Document.GetElementById("password").SetAttribute("value", "Welcome123");

4、下拉、复选、多选:

//下拉框:
secret.SetAttribute("value", "question1"); 
//复选框
rememberme.SetAttribute("Checked", "True");
//多选框
cookietime.SetAttribute("checked", "checked");

5、根据已知有ID的元素操作没有ID的元素:
HtmlElement btnDelete = webBrowser1.Document.GetElementById(passengerId).Parent.Parent.Parent.Parent.FirstChild.FirstChild.Children[1].FirstChild.FirstChild;

根据Parent,FirstChild,Children[1]数组,多少层级的元素都能找到。

6、获取Div或其他元素的样式:
webBrowser1.Document.GetElementById("addDiv").Style;

7、直接执行页面中的脚本函数,带动态参数或不带参数都行:
Object[] objArray = new Object[1];
objArray[0] = (Object)this.labFlightNumber.Text;
webBrowser1.Document.InvokeScript("ticketbook", objArray);
webBrowser1.Document.InvokeScript("return false");

8、自动点击、自动提交:
HtmlElement btnAdd = doc.GetElementById("addDiv").FirstChild;
btnAdd.InvokeMember("Click");

9、自动赋值,然后点击提交按钮的时候如果出现脚本错误或一直加载的问题,一般都是点击事件执行过快,这时需要借助Timer控件延迟执行提交按钮事件:

this.timer1.Enabled = true;
this.timer1.Interval = 1000 * 2;
private void timer1_Tick(object sender, EventArgs e)
{
this.timer1.Enabled = false;
ClickBtn.InvokeMember("Click");//执行按扭操作
}

10、屏蔽脚本错误:
将WebBrowser控件ScriptErrorsSuppressed设置为True即可

11、自动点击弹出提示框:

private void webBrowser1_Navigated(object sender, WebBrowserNavigatedEventArgs e)
{
//自动点击弹出确认或弹出提示
IHTMLDocument2 vDocument = (IHTMLDocument2)webBrowser1.Document.DomDocument;
vDocument.parentWindow.execScript("function confirm(str){return true;} ", "javascript"); //弹出确认
vDocument.parentWindow.execScript("function alert(str){return true;} ", "javaScript");//弹出提示
}

WebBrowser页面加载完毕之后,在页面中进行一些自动化操作的时候弹出框的自动点击(屏蔽)

private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
{
//自动点击弹出确认或弹出提示
IHTMLDocument2 vDocument = (IHTMLDocument2)webBrowser1.Document.DomDocument;
vDocument.parentWindow.execScript("function confirm(str){return true;} ", "javascript"); //弹出确认
vDocument.parentWindow.execScript("function alert(str){return true;} ", "javaScript");//弹出提示
//下面是你的执行操作代码
}

12、获取网页中的Iframe,并设置Iframe的src
HtmlDocument docFrame = webBrowser1.Document.Window.Frames["mainFrame"].Document; 
或
HtmlDocument docFrame = webBrowser1.Document.All.Frames["mainFrame"].Document; 
docFrame.All["mainFrame"].SetAttribute("src", "");

13、网页中存在Iframe的时候webBrowser1.Url和webBrowser1_DocumentCompleted中的e.Url不一样,前者是主框架的Url,后者是当前活动框口的Url。

14、让控件聚焦
this.webBrowser1.Select();
this.webBrowser1.Focus();
doc.All["TPL_password_1"].Focus();

15、打开本地网页文件
webBrowser1.Navigate(Application.StartupPath + @"\Test.html");

16、获取元素、表单

//根据Name获取元素
public HtmlElement GetElement_Name(WebBrowser wb,string Name)
{
HtmlElement e = wb.Document.All[Name];
return e;
}

//根据Id获取元素
public HtmlElement GetElement_Id(WebBrowser wb, string id)
{
HtmlElement e = wb.Document.GetElementById(id);
return e;
}

//根据Index获取元素
public HtmlElement GetElement_Index(WebBrowser wb,int index)
{
HtmlElement e = wb.Document.All[index];
return e;
}

//获取form表单名name,返回表单
public HtmlElement GetElement_Form(WebBrowser wb,string form_name)
{
HtmlElement e = wb.Document.Forms[form_name];
return e;
}

//设置元素value属性的值
public void Write_value(HtmlElement e,string value)
{
e.SetAttribute("value", value);
}

//执行元素的方法,如:click,submit(需Form表单名)等
public void Btn_click(HtmlElement e,string s)
{

e.InvokeMember(s);
}