article-extractor

A Node.js module to retrieve article content and metadata from a URL.

This module is under heavy development! Its quality and API will probably change a lot, so keep an eye out for any changes.

To see what features are coming up next, or if you'd like to suggest one yourself, go here: #3

Demo

You can see article-extractor in action here:

GET http://article-extractor.thomastuts.com/parse?url=AN_ARTICLE_URL

Installation

npm install --save article-extractor

Extracting data

var extractor = require('article-extractor');

extractor.extractData('http://paulgraham.com/altair.html', function (err, data) {
  console.log(data);
});

Extract result

The result looks like this:

{
    "domain": "thomastuts.com",
    "author": "Thomas Tuts",
    "title": "Article Extractor Demo",
    "summary": "A Node.js module to retrieve article content and metadata from a URL.",
    "content": "<p>This is the article content.</p>"
}

Name		Name	Last commit message	Last commit date
Latest commit History 44 Commits
demo		demo
lib		lib
.gitignore		.gitignore
README.md		README.md
index.js		index.js
package.json		package.json
test.js		test.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

article-extractor

Demo

Installation

Extracting data

Extract result

About

Releases

Packages

Contributors 2

Languages

thomastuts/article-extractor

Folders and files

Latest commit

History

Repository files navigation

article-extractor

Demo

Installation

Extracting data

Extract result

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages