rewrite some supertypes to fix fit methods with eachrow, eachslice, etc.

joshday · joshday · commit a9ceadd340f7 · 2023-06-12T10:42:25.000-04:00
diff --git a/Project.toml b/Project.toml
@@ -1,6 +1,6 @@
 name = "OnlineStats"
 uuid = "a15396b6-48d5-5d58-9928-6d29437db91e"
-version = "1.6.1"
+version = "1.6.2"
 
 [deps]
 AbstractTrees = "1520ce14-60c1-5f80-bbc7-55ef81b5835c"
diff --git a/src/OnlineStats.jl b/src/OnlineStats.jl
@@ -58,9 +58,9 @@ export
     OnlineStat, BiasVec
 
 #-----------------------------------------------------------------------------# utils
-const Tup = Union{Tuple, NamedTuple}
-const VectorOb = Union{AbstractVector, Tup}
-const XY{T,S} = Union{Tuple{T,S}, Pair{T,S}, NamedTuple{names,Tuple{T,S}}} where {names,T<:AbstractVector{<:Number},S<:Number}
+const Tup{T} = Union{NTuple{N,T} where {N}, NamedTuple{names, Tuple{N,<:T} where {N}} where {names}}
+const VectorOb{T} = Union{AbstractVector{<:T}, Tup{T}}
+const XY{T,S} = Union{Tuple{T,S}, Pair{T,S}, NamedTuple{names,Tuple{T,S}}} where {names,T<:VectorOb{Number},S<:Number}
 
 const ϵ = 1e-7  # avoid dividing by 0 in some cases
 
diff --git a/src/stats/distributions.jl b/src/stats/distributions.jl
@@ -166,7 +166,7 @@ distribution is returned as 1.
     x = [1 2 3; 4 8 12]
     fit!(FitMultinomial(3), x)
 """
-mutable struct FitMultinomial{T} <: OnlineStat{VectorOb}
+mutable struct FitMultinomial{T} <: OnlineStat{VectorOb{Number}}
     grp::Group{T}
 end
 
@@ -176,7 +176,7 @@ nobs(o::FitMultinomial) = nobs(o.grp)
 function value(o::FitMultinomial)
     m = value.(o.grp.stats)
     p = length(o.grp)
-    outvec = all(x-> x==0.0, m) ? ones(p) ./ p : collect(m) ./ sum(m)
+    outvec = all(iszero, m) ? ones(p) ./ p : collect(m) ./ sum(m)
     return 1, outvec
 end
 _merge!(o::FitMultinomial, o2::FitMultinomial) = _merge!(o.grp, o2.grp)
@@ -192,7 +192,7 @@ Online parameter estimate of a `d`-dimensional MvNormal distribution (MLE).
     y = randn(100, 2)
     o = fit!(FitMvNormal(2), eachrow(y))
 """
-struct FitMvNormal{C <: CovMatrix} <: OnlineStat{VectorOb}
+struct FitMvNormal{C <: CovMatrix} <: OnlineStat{VectorOb{Number}}
     cov::C
 end
 FitMvNormal(p::Integer) = FitMvNormal(CovMatrix(p))
@@ -214,4 +214,4 @@ _merge!(o::FitMvNormal, o2::FitMvNormal) = _merge!(o.cov, o2.cov)
 
 Statistics.mean(o::FitMvNormal) = mean(o.cov)
 Statistics.var(o::FitMvNormal) = var(o.cov)
-Statistics.cov(o::FitMvNormal) = cov(o.cov)
+Statistics.cov(o::FitMvNormal) = cov(o.cov)
diff --git a/src/stats/linreg.jl b/src/stats/linreg.jl
@@ -79,7 +79,7 @@ parameter `λ`.  An intercept (`bias`) term is added by default.
 
     coef(o; y=7, x=[2,5,4])
 """
-mutable struct LinRegBuilder{W} <: OnlineStat{VectorOb}
+mutable struct LinRegBuilder{W} <: OnlineStat{VectorOb{Number}}
     A::Matrix{Float64}  #  x'x, pretend that x = [x, 1]
     weight::W
     n::Int
diff --git a/src/stats/nbclassifier.jl b/src/stats/nbclassifier.jl
@@ -106,7 +106,7 @@ nvars(o::NBClassifier) = length(o.init)
 nobs(o::NBClassifier) = isempty(o.d) ? 0 : sum(nobs, values(o))
 probs(o::NBClassifier) = isempty(o.d) ? zeros(0) : map(nobs, values(o)) ./ nobs(o)
 
-function _predict(o::NBClassifier, x::VectorOb, p = zeros(nkeys(o)), n = nobs(o))
+function _predict(o::NBClassifier, x::VectorOb{Number}, p = zeros(nkeys(o)), n = nobs(o))
     for (k, gk) in enumerate(values(o))
         # P(Ck)
         p[k] = log(nobs(gk) / n + ϵ)
@@ -119,7 +119,7 @@ function _predict(o::NBClassifier, x::VectorOb, p = zeros(nkeys(o)), n = nobs(o)
     sp = sum(p)
     sp == 0.0 ? p : rmul!(p, inv(sp))
 end
-function _classify(o::NBClassifier, x::VectorOb, p = zeros(nkeys(o)), n = nobs(o))
+function _classify(o::NBClassifier, x::VectorOb{Number}, p = zeros(nkeys(o)), n = nobs(o))
     _, k = findmax(_predict(o, x, p, n))
     index_to_key(o, k)
 end
@@ -129,11 +129,11 @@ function index_to_key(d, i)
     end
 end
 
-predict(o::NBClassifier, x::VectorOb) = _predict(o, x)
+predict(o::NBClassifier, x::VectorOb{Number}) = _predict(o, x)
 predict(o::NBClassifier, x) = [predict(o, xi) for xi in x]
 predict(o::NBClassifier, x::AbstractMatrix) = predict(o, OnlineStatsBase.eachrow(x))
 
-classify(o::NBClassifier, x::VectorOb) = _classify(o, x)
+classify(o::NBClassifier, x::VectorOb{Number}) = _classify(o, x)
 classify(o::NBClassifier, x) = [classify(o, xi) for xi in x]
 classify(o::NBClassifier, x::AbstractMatrix) = classify(o, OnlineStatsBase.eachrow(x))
 
@@ -151,280 +151,3 @@ function split!(o::NBClassifier)
 end
 
 entropy(o::NBClassifier) = entropy(probs(o), 2)
-
-#  function split(o::NBClassifier)
-#     nroot = [nobs(g) for g in values(o)]
-#     nleft = copy(nroot)
-#     nright = copy(nroot)
-#     split = NBSplit(length(nroot))
-#     entropy_root = entropy(o)
-#     for j in 1:nvars(o)
-#         ss = o[j]
-#         stat = merge(ss)
-#         for loc in split_candidates(stat)
-#             for k in 1:nkeys(o)
-#                 nleft[k] = round(Int, n_sent_left(ss[k], loc))
-#             end
-#             entropy_left = entropy(nleft ./ sum(nleft))
-#             @. nright = nroot - nleft
-#             entropy_right = entropy(nright ./ sum(nright))
-#             entropy_after = smooth(entropy_right, entropy_left, sum(nleft) / sum(nroot))
-#             ig = entropy_root - entropy_after
-#             if ig > split.ig
-#                 split.j = j
-#                 split.at = loc
-#                 split.ig = ig
-#                 split.nleft .= nleft
-#             end
-#         end
-#     end
-#     left = NBClassifier(collect(keys(o)), o.init)
-#     right = NBClassifier(collect(keys(o)), o.init)
-#     for (i, g) in enumerate(values(left.d))
-#         g.nobs = split.nleft[i]
-#     end
-#     for (i, g) in enumerate(values(right.d))
-#         g.nobs = nroot[i] - split.nleft[i]
-#     end
-#     o, split, left, right
-# end
-
-# #-----------------------------------------------------------------------# NBClassifier
-# """
-#     NBClassifier(group::Group, labeltype::Type)
-
-# Create a naive bayes classifier, using the stats in `group` to approximate the
-# distributions of each predictor variable conditioned on label.
-
-# - For continuous variables, use [`Hist(nbin)`](@ref).
-# - For categorical variables, use [`CountMap(T)`](@ref).
-
-# # Example
-
-#     x = randn(10^5, 10)
-#     y = rand(1:5, 10^5)
-#     o = NBClassifier(10Hist(20), Float64)
-#     series((x, y), o)
-#     predict(o, x)
-#     classify(o, x)
-# """
-# struct NBClassifier{T, G <: Group} <: ExactStat{(1, 0)}
-#     d::OrderedDict{T, G}  # class => group
-#     init::G        # empty group
-# end
-# NBClassifier(T::Type, g::G) where {G<:Group} = NBClassifier(OrderedDict{T,G}(), g)
-# NBClassifier(g::Group, T::Type) = NBClassifier(T, g)
-# function NBClassifier(labels::Vector{T}, g::G) where {T, G<:Group}
-#     NBClassifier(OrderedDict{T, G}(lab=>copy(g) for lab in labels), g)
-# end
-# NBClassifier(p::Int, T::Type, b=20) = NBClassifier(T, p * Hist(b))
-
-
-# function Base.show(io::IO, o::NBClassifier)
-#     print(io, name(o))
-#     sd = sort(o.d)
-#     for di in sd
-#         print(io, "\n    > ", first(di), " (", round(nobs(last(di)) / nobs(o), 4), ")")
-#     end
-# end
-
-# Base.keys(o::NBClassifier) = keys(o.d)
-# Base.values(o::NBClassifier) = values(o.d)
-# Base.haskey(o::NBClassifier, y) = haskey(o.d, y)
-# nvars(o::NBClassifier) = length(o.init)
-# nkeys(o::NBClassifier) = length(o.d)
-# nobs(o::NBClassifier) = sum(nobs, values(o))
-# probs(o::NBClassifier) = [nobs(g) for g in values(o)] ./ nobs(o)
-# Base.getindex(o::NBClassifier, j) = [stat[j] for stat in values(o)]
-
-# # d is an object that iterates keys in known order
-# function index_to_key(d, i)
-#     for (k, ky) in enumerate(keys(d))
-#         k == i && return ky
-#     end
-# end
-
-# function fit!(o::NBClassifier, xy, γ)
-#     x, y = xy
-#     if haskey(o, y)
-#         g = o.d[y]
-#         fit!(g, x, 1 / (nobs(g) + 1))
-#     else
-#         o.d[y] = fit!(copy(o.init), x, 1.0)
-#     end
-# end
-# entropy(o::NBClassifier) = entropy(probs(o), 2)
-
-# function _predict(o::NBClassifier, x::VectorOb, p = zeros(nkeys(o)), n = nobs(o))
-#     for (k, gk) in enumerate(values(o))
-#         # P(Ck)
-#         p[k] = log(nobs(gk) / n + ϵ)
-#         # P(xj | Ck)
-#         for j in 1:length(x)
-#             p[k] += log(pdf(gk[j], x[j]) + ϵ)
-#         end
-#         p[k] = exp(p[k])
-#     end
-#     sp = sum(p)
-#     sp == 0.0 ? p : p ./= sum(p)
-# end
-# function _classify(o::NBClassifier, x::VectorOb, p = zeros(nkeys(o)), n = nobs(o))
-#     _, k = findmax(_predict(o, x, p, n))
-#     index_to_key(o, k)
-# end
-# predict(o::NBClassifier, x::VectorOb) = _predict(o, x)
-# classify(o::NBClassifier, x::VectorOb) = _classify(o, x)
-# function classify_node(o::NBClassifier)
-#     _, k = findmax([nobs(g) for g in values(o)])
-#     index_to_key(o, k)
-# end
-# for f in [:(_predict), :(_classify)]
-#     @eval begin
-#         function $f(o::NBClassifier, x::AbstractMatrix, ::Rows = Rows())
-#             n = nobs(o)
-#             p = zeros(nkeys(o))
-#             mapslices(xi -> $f(o, xi, p, n), x, 2)
-#         end
-#         function $f(o::NBClassifier, x::AbstractMatrix, ::Cols)
-#             n = nobs(o)
-#             p = zeros(nkeys(o))
-#             mapslices(xi -> $f(o, xi, p, n), x, 1)
-#         end
-#     end
-# end
-
-# function split(o::NBClassifier)
-#     nroot = [nobs(g) for g in values(o)]
-#     nleft = copy(nroot)
-#     nright = copy(nroot)
-#     split = NBSplit(length(nroot))
-#     entropy_root = entropy(o)
-#     for j in 1:nvars(o)
-#         ss = o[j]
-#         stat = merge(ss)
-#         for loc in split_candidates(stat)
-#             for k in 1:nkeys(o)
-#                 nleft[k] = round(Int, n_sent_left(ss[k], loc))
-#             end
-#             entropy_left = entropy(nleft ./ sum(nleft))
-#             @. nright = nroot - nleft
-#             entropy_right = entropy(nright ./ sum(nright))
-#             entropy_after = smooth(entropy_right, entropy_left, sum(nleft) / sum(nroot))
-#             ig = entropy_root - entropy_after
-#             if ig > split.ig
-#                 split.j = j
-#                 split.at = loc
-#                 split.ig = ig
-#                 split.nleft .= nleft
-#             end
-#         end
-#     end
-#     left = NBClassifier(collect(keys(o)), o.init)
-#     right = NBClassifier(collect(keys(o)), o.init)
-#     for (i, g) in enumerate(values(left.d))
-#         g.nobs = split.nleft[i]
-#     end
-#     for (i, g) in enumerate(values(right.d))
-#         g.nobs = nroot[i] - split.nleft[i]
-#     end
-#     o, split, left, right
-# end
-
-# n_sent_left(o::Union{OrderStats, Hist}, loc) = sum(o, loc)
-# n_sent_left(o::CountMap, label) = o[label]
-
-# #-----------------------------------------------------------------------# NBSplit
-# # Continuous:  x[j] < at
-# # Categorical: x[j] == at
-# mutable struct NBSplit{}
-#     j::Int
-#     at::Any
-#     ig::Float64
-#     nleft::Vector{Int}
-# end
-# NBSplit(n=0) = NBSplit(0, -Inf, -Inf, zeros(Int, n))
-
-# whichchild(o::NBSplit, x) = x[o.j] < o.at ? 1 : 2
-
-# #-----------------------------------------------------------------------# NBNode
-# mutable struct NBNode{T <: NBClassifier} <: ExactStat{(1, 0)}
-#     nbc::T
-#     id::Int
-#     parent::Int
-#     children::Vector{Int}
-#     split::NBSplit
-# end
-# function NBNode(o::NBClassifier; id = 1, parent = 0, children = Int[], split = NBSplit())
-#     NBNode(o, id, parent, children, split)
-# end
-# function Base.show(io::IO, o::NBNode)
-#     print(io, "NBNode ", o.id)
-#     if o.split.j > 0
-#         print(io, " (split on $(o.split.j)")
-#     end
-# end
-
-# #-----------------------------------------------------------------------# NBTree
-# """
-#     NBTree(o::NBClassifier; maxsize=5000, splitsize=1000)
-
-# Create a decision tree where each node is a naive bayes classifier.  A node will split
-# when it reaches `splitsize` observations and no more splits will occur once `maxsize`
-# nodes are in the tree.
-
-# # Example
-
-#     x = randn(10^5, 10)
-#     y = rand(Bool, 10^5)
-#     o = NBTree(NBClassifier(10Hist(20), Bool))
-#     series((x,y), o)
-#     classify(o, x)
-# """
-# mutable struct NBTree{T<:NBNode} <: ExactStat{(1, 0)}
-#     tree::Vector{T}
-#     maxsize::Int
-#     splitsize::Int
-# end
-# function NBTree(o::NBClassifier; maxsize = 5000, splitsize = 1000)
-#     NBTree([NBNode(o)], maxsize, splitsize)
-# end
-# NBTree(args...; kw...) = NBTree(NBClassifier(args...); kw...)
-# function Base.show(io::IO, o::NBTree)
-#     print(io, "NBTree(size = $(length(o.tree)), splitsize=$(o.splitsize))")
-# end
-
-# function fit!(o::NBTree, xy, γ)
-#     x, y = xy
-#     i, node = whichleaf(o, x)
-#     fit!(node.nbc, xy, γ)
-#     if length(o.tree) < o.maxsize && nobs(node.nbc) >= o.splitsize
-#         nbc, spl, left_nbc, right_nbc = split(node.nbc)
-#         # if spl.ig > o.cp
-#             node.split = spl
-#             node.children = [length(o.tree) + 1, length(o.tree) + 2]
-#             t = length(o.tree)
-#             left =  NBNode(left_nbc,  id = t + 1, parent = i)
-#             right = NBNode(right_nbc, id = t + 2, parent = i)
-#             push!(o.tree, left)
-#             push!(o.tree, right)
-#         # end
-#     end
-# end
-
-# function whichleaf(o::NBTree, x::VectorOb)
-#     i = 1
-#     node = o.tree[i]
-#     while length(node.children) > 0
-#         i = node.children[whichchild(node.split, x)]
-#         node = o.tree[i]
-#     end
-#     i, node
-# end
-
-# function classify(o::NBTree, x::VectorOb)
-#     i, node = whichleaf(o, x)
-#     classify_node(node.nbc)
-# end
-# function classify(o::NBTree, x::AbstractMatrix)
-#     mapslices(xi -> classify(o, xi), x, 2)
-# end
diff --git a/src/stats/statlearn.jl b/src/stats/statlearn.jl
@@ -221,11 +221,11 @@ function _merge!(o::StatLearn, o2::StatLearn)
     smooth!(o.λ, o2.λ, γ)
 end
 
-predict(o::StatLearn, x::VectorOb) = dot(x, o.β)
+predict(o::StatLearn, x::VectorOb{Number}) = dot(x, o.β)
 predict(o::StatLearn, x::AbstractMatrix) = x * o.β
 classify(o::StatLearn, x) = sign.(predict(o, x))
 
-function objective(o::StatLearn, x::AbstractMatrix, y::VectorOb)
+function objective(o::StatLearn, x::AbstractMatrix, y::VectorOb{Number})
     mean(o.loss.(y, predict(o,x))) + sum(o.λ .* o.penalty.(o.β))
 end
 
diff --git a/src/stats/stats.jl b/src/stats/stats.jl
@@ -268,7 +268,7 @@ Approximate K-Means clustering of `k` clusters.
 
     classify(o, x[1])  # returns index of cluster closest to x[1]
 """
-mutable struct KMeans{T, C <: NTuple{N, Cluster{T}} where N, W} <: OnlineStat{VectorOb}
+mutable struct KMeans{T, C <: NTuple{N, Cluster{T}} where N, W} <: OnlineStat{VectorOb{Number}}
     value::C
     buffer::Vector{T}
     rate::W
diff --git a/src/viz/recipes.jl b/src/viz/recipes.jl
diff --git a/test/runtests.jl b/test/runtests.jl