JSでテキストから項目抽出

JavaScriptでTSV(タブ区切り文字列)をパースするライブラリver0.2。Excelからのコピペ内容を表形式でそのままJSにインポート可能

概要 「JavaScriptでTSVデータをパースするライブラリ」を更新した。もとからある機能: TSVデータの取得元として,DOM要素内のinnerHTML,または関数オブジェクト内のコメントを指定できる。 今回の修正点: TSVデータのセル内の値に,\tという記法によって…

JavaScriptでTSV(タブ区切り文字列)をパースするライブラリver0.1。Excelからのコピペ内容を表形式でそのままJSにインポート可能

概要 JavaScriptでTSVデータをパースするライブラリを作成した。TSVデータの取得元として,DOM要素内のinnerHTML,または関数オブジェクト内のコメントを指定できる。詳しくは下記コードのコメント内の使用法を読むこと。 コード TsvParser.js

はてなブログのMT形式バックアップデータを解析して,見出し数や特定のタグ数を記事ごとにカウントするJavaScriptコード

はてなブログのバックアップデータは,MovableType形式だ。 このMTデータを解析して,記事ごとに特定のタグがいくつあるか?を 一覧表に集計するJavaScriptフォーム。 下記のフォームをベースに改良した。 一般テキストからテンプレートマッチングで項目を一…

複数行のテンプレートマッチング繰り返しで,項目を一覧表形式で抽出するJSコード (改良版)

下記のコードを改良。 一般テキストからテンプレートマッチングで項目を一覧表形式で抽出するJSコード (パターンの繰り返しから正規表現で連続キャプチャ) - ソフトウェア勉強ログとサンプルコード http://source-code-student.hatenablog.jp/entry/201501…

一般テキストからテンプレートマッチングで項目を一覧表形式で抽出するJSコード (パターンの繰り返しから正規表現で連続キャプチャ)

もし,文字列がデータ構造を持っていれば,パースは容易だ。たとえば: DOM XML CSV JSON これらはいずれもテキストが持つデータ構造であり,項目を抽出するのがきわめて容易。 しかし,データ構造を持たないようなテキストもある。 そういうテキストから,…

2ちゃんねるのスレッドから全レスをtable形式で抽出するJavaScriptコード

Firebugで動作する。 スレッドをブラウザ(firefox)で開いて,コンソールで実行すればよい。 var rescnt = 1; var table_src = $x("//dl[@class='thread']/dd").reduce(function( ret, i ){ ret += "<tr><td>" + rescnt + "</td><td>" + i.innerHTML.replace(/<a [^>]*>([^<]*)<\/a</a></td></tr>…