2022年
-
2022-10-12
-
2022-05-30
- 火車采集器V10.21版
-
1.新增:ftp支持七牛云上傳,http://faq.locoy.com/q-1351.html
2.新增:標簽過濾新增內容日期過濾,http://faq.locoy.com/q-1352.html
3.新增:文件下載中保存目錄和保存格式增加“[從X開始自增ID]”
4.新增:點擊運行管理列表“狀態”列可按任務運行狀態排序,便于排查任務狀態
5.提升:mysql支持8.0版本
6.修復:批量網址補0預覽無效問題
7.修復:插件管理器文件下載插件模板增加操作方法
8.修復:同url文件再次下載時沒有入庫,導致發布缺少文件問題
9.修復:設置http請求頭refer時文件探測下載生效,正式下載無效問題
10.修復:web發布模塊登錄驗證碼顯示不全問題
11.修復:單次替換和批量替換中的“忽略大小寫”設置無效問題
12.修復:勾選數據管理“已采”時,更改“已發”為勾選問題
-
2022-02-28
- 火車采集器V10.2版
-
1.新增:User-Agent支持從文本讀取并隨機切換。教程:http://faq.locoy.com/q-1348.html。
2.新增:自動識別手機號功能支持14、15、16、17、19開頭的新號段。
3.優化:文件下載完畢插件接口優化。
4.優化:探測文件下載時正式下載文件,提升下載速度。
5.修復:http請求頭“Header或設置名”以數字開頭的名稱報錯的問題修復。
6.修復:發布到word文檔,如果數據包含特殊字符或本地圖片異常會導致發布失敗問題修復。
7.修復:拷貝任務時,任務備注未拷貝問題修復。
8.修復:標簽引用支持調用“列表頁”標簽。
9.修復:json提取時如果json對象的“鍵”是整型導致提取有誤。
10.優化:網址解析替換html問題。
11.修復:get、post分頁問題處理。
12.修復:生成固定格式的數據中“系統時間”選中“06-16”生成時間格式“yyyy-MM”
13.新增:數據庫發布模塊支持replace into語句。
2021年
-
2021-10-08
-
2021-07-05
- 火車采集器V10.0版
-
1.數據獲取中支持調用其他標簽的值作為截取條件。
2.數據獲取支持CSS selector,很多網頁的css 的屬性唯一,此功能更利于批量從網頁中提取數據。
3.增加關聯區域功能,可以截取網頁中指定區域內容進行采集處理。
4.批量網址增加區間變化的網址增加方式,適應更多的網頁地址變化方式。
5.批量設置增加新增加功能的批量設置。
6.運行統計日志設置添加默認關閉功能,可在設置中選擇開啟或關閉。
7.oss相關問題修復。
8.網址空格問題導致列表頁標簽錯誤問題修復。
9.下載相關問題修復。
10.修復“任務數據批量處理”中刪除為空記錄無效的問題。
11.文件下載插件增加文件下載后處理接口。
-
2021-03-15
2020年
-
2020-09-07
-
2020-06-15
-
2020-03-23
2019年
-
2019-12-26
-
2019-11-21
- 火車采集器V9.11版
-
1: 列表頁新增“地址處理”功能
2: 新增“請求失敗數”的預警條件設置。
3: 下載圖片命名,新增[記錄自增Id]格式
4: 修復圖片下載誤判斷問題
5: 修復計劃任務中“每天調度”,起始運行時間配置未生效的問題。
6: 修復PHP插件,對于循環記錄的處理報錯的問題。
7: 修復拼音首字母對于一些錯誤字符的判斷問題。
8: 任務批量編輯,修復“發布”中“多網站亂序發布”未能復制的問題
9: 修改“循環添加新記錄”配置后,修復數據格式選擇錯誤的問題。
10:修復循環記錄中列表頁標簽被多次處理的問題
11:修復對于一些302跳轉地址,無法正確跳轉的問題。
12:修復一些網址無法正確請求的問題
-
2019-09-05
-
2019-05-07
2018年
-
2018-12-27
-
2018-10-29
- 火車采集器V9.7.1版
-
1: Web發布模塊,對于登陸數據,增加自定數據的格式。
2: html標簽處理,增加“排除其他標簽”的處理方式。
3: 標簽的編輯,增加“多選”模式,實現批量的復制、刪除操作,按住ctrl鍵,即可選擇多個標簽。
4: 本地數據庫為sqlite時,數據庫清空時,增加數據庫的壓縮操作。
5: 修復采集器長時間行后導致的程序卡頓問題。
6: 當有分頁的時候,對于標簽增加設置提示。
7: 對于Post分頁中的【文本】,增加自定義轉義的設置。
8: 修復同步云端規則,在使用數據庫為Mysql或者SqlServer時,未能建立對應規則本地數據庫的問題。
9: 修復循環匹配與添加為新記錄的沖突問題。
10: 修復當登陸參數有隨機值,無法自動登陸的問題。
11: 修復使用Python插件時,空格變成+的問題。
12: 修復批量復制下,“最大循環次數”未復制的問題,增加起始網址的復制。
13:修復任務、分組無法拖動到根目錄下的問題。
-
2018-07-19
- 火車采集器V9.7版
-
1: 添加“重新采集上次請求失敗的列表頁”功能。
2: 優化任務發布方式,站群式發布添加支持順序、倒序發布。
3: 列表頁獨立標簽,增加“從網址中獲取”的選型。
4: 優化圖片地址匹配方式,一些原來無法匹配的圖片可以正確匹配了。
5: 同義詞替換,增加對于html標簽替換的支持。
6: 循環采集模式,增加循環次數限制。
7: 數據發布,增加自定義數據發布模式。
8: 修復刪除列表頁時,未能刪除對應列表頁標簽的問題。
9: 修復使用圖片水印時,未選擇保存格式導致的水印錯誤的bug。
10:Json工具,修復長Json處理時的卡頓問題。
11:修復采集標簽過多導致的任務無法運行的錯誤。
12:修復自定義插件編譯錯誤的問題。
13:修復PHP插件對于循環采集標簽處理時的錯誤問題。
-
2018-04-09
- 火車采集器V9.6.5版
-
1: 文本導出時,增加導出文件的編碼選擇。
2: 批量導入任務以及導入任務分組時,添加任務導入結果反饋,修復由于一個錯誤任務導致的全部出錯的問題。
3: 批量內容替換,增加文本導入的功能。
4: 二級代理自動更換代理優化,在無任務使用二級代理時,不進行代理的自動更換。
5: 請求頭信息,增加適用于全部頁面的選擇。
6: HttpPost分頁,添加對于[文本]與[分頁]進行組合的支持。
7: 修復清空網址庫時,對應的壓縮數據未能刪除的問題。
8: 修復圖片添加水印時,水印覆蓋錯誤的問題。
9: 修復批量編輯任務時,內容頁“其他設置”未能復制的問題。
10:存儲過程sql驗證優化,防止一些正確語句被錯誤提示的問題。
-
2018-02-02
-
2018-01-26
- 火車采集器V9.6.3版
-
1: 修復使用PHP插件,無法獲取請求cookie的問題。
2: 批量網址處理中,時間格式增加轉換為“時間戳”的功能。
3: 修復“智能提取電話”功能意外變為“智能提取郵箱”的bug。
4: 無限極列表頁采集,是否由于重復數據而停止修改為可配置(原為自動停止采集)。
5: 修復老板鍵設置為空之后,會默認變成 CtrL+Alt的bug。
6: 修復由于沒有水印配置,導致的程序批量復制出錯的問題。
7: 修復由于多頁未能獲取到,導致由多頁獲取數據的標簽丟失的bug。
8: 發布模塊,數據庫的編碼增加utf8mb4格式支持。
9: 修復分頁循環匹配時,組合標簽僅獲取第一頁的bug
10:優化批量網址處理中,由于數據量太多而導致程序卡頓的問題。
2017年
-
2017-12-12
-
2017-10-26
-
2017-09-09
- 火車采集器V9.6版
-
1: 多級網址列表,對于列表名增加重命名功能以及上下調整的功能。
2: 修復SqlServer數據庫格式下,未能正確顯示采集數量的問題。
3: 修復在新增標簽時,若上一個編輯為固定格式數據,則新增的標簽顯示內容錯誤的問題。
4: 修復數據包登錄中,若登錄失效,未能自動重新登錄的問題。
5: 修復FTP上傳失敗后,本地數據也被刪除的問題。
6: 修復邊采集邊發時,文件上傳FTP失敗的問題。
7: 優化Excel保存時,對于ID,PageUrl顯示列的位置。
8: 修復任務不能多選操作的問題。
9: 邊采集邊發布時,最大發布數的功能調整(原:最大發布數無效。 現:最大發布數生效,且在任務完成后,不會將以前的未發布數據再次發布)
10:修復對于存儲過程語句,當數據為空值時,意外判斷為“語句錯誤”的問題。
11:二級代理功能,修復定時撥號失效的問題。
12:二級代理功能,定時獲取API功能優化,重新獲取時,會自動刪除上一批數據。
13:批量網址增加數據庫導入的模式
14:導出到文件時,對于不合理的錯誤命名增加提示。
15:導出規則時,對于規則名稱過長的規則,增加提示的功能。
16:規則編輯時,對于“包含”、“不包含”數據,復制粘貼多行時,會自動區分為多個數據。
17:添加對于芝麻代理的合作支持。
18:數據庫導入批量網址
-
2017-06-21
- 火車采集器V9.5版
-
1: 調整列表頁排重的方式,現在僅會在同級列表頁之間進行排重。
2: 增加對于任務運行完畢之后的運行統計的預警功能(Email郵件預警)【旗艦版功能】
3: 新增支持對于一些請求返回碼不為200時,仍然進行采集的配置。
4: 新增支持將下載地址保存為html文件的功能。
5: 二次代理服務,增加導入的時候配置代理類型,同時修復對于用戶名密碼的顯示錯誤問題。
6: 發布配置頁面,默認僅顯示當前選擇配置,加快任務加載時間。
7: 修復命令行控制,closeapp參數無法自動關閉程序的問題。
8: 修復在未選擇圖片水印時,無法進行圖片剪裁的問題。
9: 優化開始界面加載方式,解決初始化界面卡頓的問題。
10:修復在配置多行連接符包含“|”導致的無法探測圖片下載的問題。
11:修復Excel導出數據時,列的順序與字段順序不一致的問題。
12:修復Excel導出數據時,一些包含數字的字段的導出數據錯誤問題。
13:修復任務批量編輯時,Json采集表達式未能復制的問題。
-
2017-03-02
2015年
-
2015-12-14
-
2015-09-17
- 火車采集器V9.0版
-
1.全新界面,更好的UI及用戶體驗
2.新架構、新內核,使用9年的.NET2.0框架升級到.NET4.0框架
3.支持最新的Win10系統中運行
4.二級代理服務器新增Socks代理
5.優化采集流程,大幅提升采集及入庫速度
6.任務運行過程中可修改線程數等參數,實時調節運行速度
7.支持SSH(SFTP文件)上傳
8.內容提取新增JSON提取方式,提取JSON數據更加簡單。
9.新增C#源碼類型插件,可以直接編輯插件源碼,實時生效。
10.軟件閃退,支持保存未完成的任務進度
11.任務運行合并到統一界面,添加“實時數據”查看和“任務詳情”統計
12.列表頁,分頁,多頁自定義任意Header請求頭等功能
13.批量修改任務規則細節參數,批量修改Web發布配置
14.起始網址批量網址的地址格式可添加多個地址參數,支持自定義列表參數
15.標簽數據來源更細致化,可設置從默認頁,分頁,多頁的源碼,URL地址及返回頭信息中提取
16.標簽數據處理新增統計標簽字符串長度、批量替換功能
17.修改原有的無限級列表頁網址獲取模式,無限級配置更加簡單
-
2015-03-23
2014年
-
2014-12-10
-
2014-06-18
-
2014-04-09
-
2014-02-24