Skip to content

Cannot return all hits with get_chebiid() #431

@stitam

Description

@stitam

get_chebiid() returns max 200 hits by default and limiting hits works fine:

webchem::get_chebiid("C#C", from = "smiles", max_res = 10)$chebiid
#>  [1] "CHEBI:35328"  "CHEBI:51972"  "CHEBI:62743"  "CHEBI:79065"  "CHEBI:62474" 
#>  [6] "CHEBI:51089"  "CHEBI:32882"  "CHEBI:74165"  "CHEBI:167520" "CHEBI:167521"

Created on 2025-07-15 with reprex v2.1.1

If I look for C#C online there are way more hits for this query (more than 10k).

I tried setting a huge number to get all of them, but then it just defaults to 200:

webchem::get_chebiid("C#C", from = "smiles", max_res = 1e+05)$chebiid
#>   [1] "CHEBI:35328"  "CHEBI:51972"  "CHEBI:62743"  "CHEBI:79065"  "CHEBI:62474" 
#>   [6] "CHEBI:51089"  "CHEBI:32882"  "CHEBI:74165"  "CHEBI:167520" "CHEBI:167521"
#>  [11] "CHEBI:35330"  "CHEBI:45657"  "CHEBI:37609"  "CHEBI:3136"   "CHEBI:133327"
#>  [16] "CHEBI:9638"   "CHEBI:35336"  "CHEBI:62480"  "CHEBI:62481"  "CHEBI:91221" 
#>  [21] "CHEBI:91223"  "CHEBI:132450" "CHEBI:85932"  "CHEBI:88265"  "CHEBI:6602"  
#>  [26] "CHEBI:15948"  "CHEBI:62466"  "CHEBI:177905" "CHEBI:177907" "CHEBI:180470"
#>  [31] "CHEBI:180471" "CHEBI:51091"  "CHEBI:132025" "CHEBI:132325" "CHEBI:141560"
#>  [36] "CHEBI:142625" "CHEBI:165735" "CHEBI:22610"  "CHEBI:22612"  "CHEBI:26541" 
#>  [41] "CHEBI:90077"  "CHEBI:8907"   "CHEBI:17546"  "CHEBI:27049"  "CHEBI:28627" 
#>  [46] "CHEBI:35331"  "CHEBI:62450"  "CHEBI:63065"  "CHEBI:77474"  "CHEBI:77579" 
#>  [51] "CHEBI:79063"  "CHEBI:80134"  "CHEBI:80167"  "CHEBI:83043"  "CHEBI:87530" 
#>  [56] "CHEBI:132451" "CHEBI:138599" "CHEBI:138600" "CHEBI:139179" "CHEBI:141222"
#>  [61] "CHEBI:132246" "CHEBI:132259" "CHEBI:18092"  "CHEBI:62742"  "CHEBI:35309" 
#>  [66] "CHEBI:45707"  "CHEBI:62449"  "CHEBI:62505"  "CHEBI:80214"  "CHEBI:16833" 
#>  [71] "CHEBI:27547"  "CHEBI:27740"  "CHEBI:35332"  "CHEBI:53157"  "CHEBI:62463" 
#>  [76] "CHEBI:80133"  "CHEBI:87246"  "CHEBI:138919" "CHEBI:143013" "CHEBI:53153" 
#>  [81] "CHEBI:53161"  "CHEBI:53166"  "CHEBI:65210"  "CHEBI:72647"  "CHEBI:88267" 
#>  [86] "CHEBI:90866"  "CHEBI:90867"  "CHEBI:91293"  "CHEBI:136535" "CHEBI:137361"
#>  [91] "CHEBI:140238" "CHEBI:140316" "CHEBI:2700"   "CHEBI:15843"  "CHEBI:32389" 
#>  [96] "CHEBI:32395"  "CHEBI:34306"  "CHEBI:37834"  "CHEBI:52449"  "CHEBI:60943" 
#> [101] "CHEBI:65341"  "CHEBI:65342"  "CHEBI:66291"  "CHEBI:71488"  "CHEBI:71563" 
#> [106] "CHEBI:72853"  "CHEBI:73152"  "CHEBI:75913"  "CHEBI:76180"  "CHEBI:76185" 
#> [111] "CHEBI:76188"  "CHEBI:76499"  "CHEBI:76624"  "CHEBI:76633"  "CHEBI:76965" 
#> [116] "CHEBI:77222"  "CHEBI:77227"  "CHEBI:77229"  "CHEBI:77231"  "CHEBI:77232" 
#> [121] "CHEBI:77233"  "CHEBI:77234"  "CHEBI:77235"  "CHEBI:77236"  "CHEBI:77526" 
#> [126] "CHEBI:77528"  "CHEBI:77532"  "CHEBI:77534"  "CHEBI:77535"  "CHEBI:77536" 
#> [131] "CHEBI:77538"  "CHEBI:77539"  "CHEBI:77577"  "CHEBI:78033"  "CHEBI:83030" 
#> [136] "CHEBI:83344"  "CHEBI:84856"  "CHEBI:84873"  "CHEBI:84876"  "CHEBI:85929" 
#> [141] "CHEBI:85942"  "CHEBI:85954"  "CHEBI:88264"  "CHEBI:90079"  "CHEBI:136918"
#> [146] "CHEBI:142545" "CHEBI:191854" "CHEBI:197291" "CHEBI:229686" "CHEBI:28364" 
#> [151] "CHEBI:50173"  "CHEBI:50174"  "CHEBI:50175"  "CHEBI:53164"  "CHEBI:53207" 
#> [156] "CHEBI:53488"  "CHEBI:58562"  "CHEBI:65136"  "CHEBI:71467"  "CHEBI:76189" 
#> [161] "CHEBI:76636"  "CHEBI:76639"  "CHEBI:76959"  "CHEBI:76962"  "CHEBI:77201" 
#> [166] "CHEBI:77203"  "CHEBI:77206"  "CHEBI:77210"  "CHEBI:77212"  "CHEBI:77214" 
#> [171] "CHEBI:77216"  "CHEBI:77218"  "CHEBI:77224"  "CHEBI:77226"  "CHEBI:77228" 
#> [176] "CHEBI:77230"  "CHEBI:77243"  "CHEBI:77246"  "CHEBI:77360"  "CHEBI:77368" 
#> [181] "CHEBI:77372"  "CHEBI:77375"  "CHEBI:77379"  "CHEBI:77404"  "CHEBI:77499" 
#> [186] "CHEBI:77503"  "CHEBI:77527"  "CHEBI:77531"  "CHEBI:77541"  "CHEBI:77542" 
#> [191] "CHEBI:82731"  "CHEBI:83424"  "CHEBI:84307"  "CHEBI:84308"  "CHEBI:84892" 
#> [196] "CHEBI:84893"  "CHEBI:84937"  "CHEBI:85245"  "CHEBI:85246"  "CHEBI:85931"

Created on 2025-07-15 with reprex v2.1.1

get_chebiid() should be updated such that it can just return all the hits. Maybe this should be the default?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions