jagregory/wikibands.go

## wikibands.go
package main

import (
	"compress/bzip2"
	"encoding/xml"
	"fmt"
	"io"
	"log"
	"os"
	"strings"
)

func main() {
	filename := os.Args[1]

	f, err := os.Open(filename)
	if err != nil {
		log.Fatal("Unable to read zip", err)
	}
	defer f.Close()

	r := bzip2.NewReader(f)
	dec := xml.NewDecoder(r)

	currentElement := ""
	currentTitle := ""

	for {
		token, err := dec.Token()
		if err != nil {
			if err == io.EOF {
				log.Println("End of file.")
				break
			}

			log.Fatal("Error reading zip", err)
		}

		if start, ok := token.(xml.StartElement); ok {
			currentElement = start.Name.Local

			if currentElement == "page" {
				currentTitle = ""
			}
		} else if _, ok := token.(xml.EndElement); ok {
			currentElement = ""
		}

		if char, ok := token.(xml.CharData); ok {
			if currentElement == "title" {
				currentTitle = string(char)
			} else if currentElement == "text" {
				text := string(char)
				if strings.Contains(text, "{{Infobox musical artist") {
					fmt.Print(currentTitle)
					fmt.Print("\n")
				}
			}
		}
	}
}
	package main

	import (
	"compress/bzip2"
	"encoding/xml"
	"fmt"
	"io"
	"log"
	"os"
	"strings"
	)

	func main() {
	filename := os.Args[1]

	f, err := os.Open(filename)
	if err != nil {
	log.Fatal("Unable to read zip", err)
	}
	defer f.Close()

	r := bzip2.NewReader(f)
	dec := xml.NewDecoder(r)

	currentElement := ""
	currentTitle := ""

	for {
	token, err := dec.Token()
	if err != nil {
	if err == io.EOF {
	log.Println("End of file.")
	break
	}

	log.Fatal("Error reading zip", err)
	}

	if start, ok := token.(xml.StartElement); ok {
	currentElement = start.Name.Local

	if currentElement == "page" {
	currentTitle = ""
	}
	} else if _, ok := token.(xml.EndElement); ok {
	currentElement = ""
	}

	if char, ok := token.(xml.CharData); ok {
	if currentElement == "title" {
	currentTitle = string(char)
	} else if currentElement == "text" {
	text := string(char)
	if strings.Contains(text, "{{Infobox musical artist") {
	fmt.Print(currentTitle)
	fmt.Print("\n")
	}
	}
	}
	}
	}