노코기리 문서를 루비 해시로 변환
노코기리 XML 문서를 해시로 변환하는 쉬운 방법이 있습니까?
레일즈 같은 것.Hash.from_xml
.
Nokogiri XML 문서를 해시로 변환하려면 다음 작업만 수행합니다.
require 'active_support/core_ext/hash/conversions'
hash = Hash.from_xml(nokogiri_document.to_s)
요소 및 특성에 대한 네임스페이스 정보를 포함하는 강력한 해시를 생성하는 훨씬 간단한 버전은 다음과 같습니다.
require 'nokogiri'
class Nokogiri::XML::Node
TYPENAMES = {1=>'element',2=>'attribute',3=>'text',4=>'cdata',8=>'comment'}
def to_hash
{kind:TYPENAMES[node_type],name:name}.tap do |h|
h.merge! nshref:namespace.href, nsprefix:namespace.prefix if namespace
h.merge! text:text
h.merge! attr:attribute_nodes.map(&:to_hash) if element?
h.merge! kids:children.map(&:to_hash) if element?
end
end
end
class Nokogiri::XML::Document
def to_hash; root.to_hash; end
end
작동 중에 볼 수:
xml = '<r a="b" xmlns:z="foo"><z:a>Hello <b z:m="n" x="y">World</b>!</z:a></r>'
doc = Nokogiri::XML(xml)
p doc.to_hash
#=> {
#=> :kind=>"element",
#=> :name=>"r",
#=> :text=>"Hello World!",
#=> :attr=>[
#=> {
#=> :kind=>"attribute",
#=> :name=>"a",
#=> :text=>"b"
#=> }
#=> ],
#=> :kids=>[
#=> {
#=> :kind=>"element",
#=> :name=>"a",
#=> :nshref=>"foo",
#=> :nsprefix=>"z",
#=> :text=>"Hello World!",
#=> :attr=>[],
#=> :kids=>[
#=> {
#=> :kind=>"text",
#=> :name=>"text",
#=> :text=>"Hello "
#=> },
#=> {
#=> :kind=>"element",
#=> :name=>"b",
#=> :text=>"World",
#=> :attr=>[
#=> {
#=> :kind=>"attribute",
#=> :name=>"m",
#=> :nshref=>"foo",
#=> :nsprefix=>"z",
#=> :text=>"n"
#=> },
#=> {
#=> :kind=>"attribute",
#=> :name=>"x",
#=> :text=>"y"
#=> }
#=> ],
#=> :kids=>[
#=> {
#=> :kind=>"text",
#=> :name=>"text",
#=> :text=>"World"
#=> }
#=> ]
#=> },
#=> {
#=> :kind=>"text",
#=> :name=>"text",
#=> :text=>"!"
#=> }
#=> ]
#=> }
#=> ]
#=> }
libxml-ruby(1.1.3)와 함께 이 코드를 사용합니다.저도 노코기리를 사용해 본 적은 없지만 어쨌든 libxml-ruby를 사용하는 것으로 알고 있습니다.또한 xml 요소를 루비 객체에 매핑하는 ROXML(http://github.com/Empact/roxml/tree) 을 살펴보시기 바랍니다. libxml 위에 구축되어 있습니다.
# USAGE: Hash.from_libxml(YOUR_XML_STRING)
require 'xml/libxml'
# adapted from
# http://movesonrails.com/articles/2008/02/25/libxml-for-active-resource-2-0
class Hash
class << self
def from_libxml(xml, strict=true)
begin
XML.default_load_external_dtd = false
XML.default_pedantic_parser = strict
result = XML::Parser.string(xml).parse
return { result.root.name.to_s => xml_node_to_hash(result.root)}
rescue Exception => e
# raise your custom exception here
end
end
def xml_node_to_hash(node)
# If we are at the root of the document, start the hash
if node.element?
if node.children?
result_hash = {}
node.each_child do |child|
result = xml_node_to_hash(child)
if child.name == "text"
if !child.next? and !child.prev?
return result
end
elsif result_hash[child.name.to_sym]
if result_hash[child.name.to_sym].is_a?(Object::Array)
result_hash[child.name.to_sym] << result
else
result_hash[child.name.to_sym] = [result_hash[child.name.to_sym]] << result
end
else
result_hash[child.name.to_sym] = result
end
end
return result_hash
else
return nil
end
else
return node.content.to_s
end
end
end
end
XML을 단순히 해시로 변환하려다가 발견했습니다(레일에 없음).노코기리를 쓸까 하다가 결국 노리로 가게 되었습니다.
내 암호는 트리벌(triple)이었습니다.
response_hash = Nori.parse(response)
다른 사용자들은 이것이 작동하지 않는다고 지적했습니다.확인을 못 했는데 parse 메서드가 클래스에서 인스턴스로 이동된 것 같습니다.위의 제 코드는 어느 시점에서 작동했습니다.새(확인되지 않은) 코드는 다음과 같습니다.
response_hash = Nori.new.parse(response)
Nokogiri를 사용하여 루비 해시에 대한 XML 응답을 구문 분석합니다.꽤 빠르네요.
doc = Nokogiri::XML(response_body)
Hash.from_xml(doc.to_s)
구성에 이와 같은 것을 정의하는 경우:
ActiveSupport::XmlMini.backend = 'Nokogiri'
그것은 노코기리의 모듈을 포함하고 당신은 그것을 얻습니다.to_hash
방법.
노코기리 XML 노드를 위해 제가 만든 간단한 믹스인을 보세요.
http://github.com/kuroir/Nokogiri-to-Hash
사용 예는 다음과 같습니다.
require 'rubygems'
require 'nokogiri'
require 'nokogiri_to_hash'
html = '
<div id="hello" class="container">
<p>Hello! visit my site <a href="http://kuroir.com">Kuroir.com</a></p>
</div>
'
p Nokogiri.HTML(html).to_hash
=> [{:div=>{:class=>["container"], :children=>[{:p=>{:children=>[{:a=>{:href=>["http://kuroir.com"], :children=>[]}}]}}], :id=>["hello"]}}]
Nokogiri에서 선택한 노드가 하나의 태그로만 구성되어 있는 경우 키와 값을 추출하고 다음과 같이 하나의 해시로 압축할 수 있습니다.
@doc ||= Nokogiri::XML(File.read("myxmldoc.xml"))
@node = @doc.at('#uniqueID') # this works if this selects only one node
nodeHash = Hash[*@node.keys().zip(@node.values()).flatten]
Ruby 배열 병합에 대한 자세한 내용은 http://www.ruby-forum.com/topic/125944 을 참조하십시오.
언급URL : https://stackoverflow.com/questions/1230741/convert-a-nokogiri-document-to-a-ruby-hash
'programing' 카테고리의 다른 글
Larvel에서 수동 설정으로 데이터베이스와 연결할 수 없습니다. (0) | 2023.10.13 |
---|---|
워드프레스 폼취급 (0) | 2023.10.13 |
워드프레스에서 포스트아이디를 사용하여 포스트 썸네일을 얻는 방법? (0) | 2023.10.13 |
XmlDocument를 사용하여 XML 문서를 만드는 방법은 무엇입니까? (0) | 2023.10.13 |
포스트 컨텐츠에서 WordPress 숏코드 속성을 추출하는 방법 (0) | 2023.10.13 |